目录
- 1. C++ 语言扩展
- 1.1. 函数执行空间标识符
- 1.2. 变量存储空间标识符
- 1.3. 内置类型
- 1.4. 内置向量类型
- 1.5. 内置变量
- 1.6. Memory Fence函数
- 1.7. 同步函数
- 1.8. 数学函数
- 1.8.1. 半精度(half)算术函数
- 1.8.2. half2算术函数
- 1.8.3. half比较函数
- 1.8.4. half2比较函数
- 1.8.5. 半精度转换与数据移动函数
- 1.8.6. half数学函数
- 1.8.7. half2数学函数
- 1.8.8. Bfloat16算术函数
- 1.8.9. Bfloat162算术函数
- 1.8.10. Bfloat16比较函数
- 1.8.11. Bfloat162比较函数
- 1.8.12. Bfloat16精度转换与数据移动函数
- 1.8.13. Bfloat16数学函数
- 1.8.14. Bfloat162数学函数
- 1.8.15. 单精度数学函数
- 1.8.16. 双精度数学函数
- 1.8.17. 整数型度数学函数
- 1.8.18. 单精度intrinsic
- 1.8.19. 双精度intrinsic
- 1.8.20. 整数型intrinsic
- 1.8.21. 类型转换intrinsic
- 1.8.22. SIMD intrinsic
- 1.9. Texture函数
- 1.10. 只读数据缓存区加载函数
- 1.11. 使用缓存提示的加载函数
- 1.12. 使用缓存提示的存储函数
- 1.13. 时间函数
- 1.14. Atomic函数
- 1.15. 地址空间谓词函数
- 1.16. 地址空间转换函数
- 1.17. Alloca函数
- 1.18. 编译器优化提示函数
- 1.19. Warp Vote函数
- 1.20. Warp Match函数
- 1.21. Warp Reduce函数
- 1.22. Warp Shuffle函数
- 1.23. Nanosleep函数
- 1.24. Warp matrix函数
- 1.25. Asynchronous Data Copies
- 1.26. Assert函数
- 1.27. Trap函数
- 1.28. Breakpoint函数
- 1.29. 格式化输出
- 1.30. 动态Global内存操作
- 1.31. 执行配置
- 1.32. Launch Bounds(启动边界)
- 1.33. #pragma unroll
- 1.34. 关于内联汇编
- 2. Cooperative Groups
- 3. C++ 语言支持