曦云系列通用计算GPU mcBLAS API参考
1. 简介
1.1. 安装mcBLAS
1.2. Hello mcBLAS
1.3. 数据布局
2. 使用mcBLAS API
2.1. mcBLAS数据类型
2.1.1. mcblasHandle_t
2.1.2. mcblas_int
2.1.3. mcblas_stride
2.1.4. mcblas_half
2.1.5. mcComplex
2.1.6. mcDoubleComplex
2.1.7. mcblasStatus_t
2.1.8. macaDataType_t
2.1.9. mcblasOperation_t
2.1.10. mcblasFillMode_t
2.1.11. mcblasDiagType_t
2.1.12. mcblasSideMode_t
2.1.13. mcblasPointerMode_t
2.1.14. mcblasAtomicsMode_t
2.1.15. mcblasGemmAlgo_t
2.1.16. mcblasMath_t
2.1.17. mcblasComputeType_t
2.2. mcBLAS辅助函数
2.2.1. mcblasCreate()
2.2.2. mcblasDestroy()
2.2.3. mcblasGetVersion()
2.2.4. mcblasGetProperty()
2.2.5. mcblasGetStatusName()
2.2.6. mcblasGetStatusString()
2.2.7. mcblasSetStream()
2.2.8. mcblasSetWorkspace()
2.2.9. mcblasGetStream()
2.2.10. mcblasGetPointerMode()
2.2.11. mcblasSetPointerMode()
2.2.12. mcblasSetVector()
2.2.13. mcblasGetVector()
2.2.14. mcblasSetMatrix()
2.2.15. mcblasGetMatrix()
2.2.16. mcblasSetVectorAsync()
2.2.17. mcblasGetVectorAsync()
2.2.18. mcblasSetMatrixAsync()
2.2.19. mcblasGetMatrixAsync()
2.2.20. mcblasSetAtomicsMode()
2.2.21. mcblasGetAtomicsMode()
2.2.22. mcblasSetMathMode()
2.2.23. mcblasGetMathMode()
2.2.24. mcblasSetSmCountTarget()
2.2.25. mcblasGetSmCountTarget()
2.2.26. mcblasLoggerConfigure()
2.2.27. mcblasGetLoggerCallback()
2.2.28. mcblasSetLoggerCallback()
2.3. mcBLAS Level-1函数
2.3.1. mcblasI<t>amax()
2.3.2. mcblasI<t>amin()
2.3.3. mcblas<t>asum()
2.3.4. mcblas<t>axpy()
2.3.5. mcblas<t>copy()
2.3.6. mcblas<t>dot()
2.3.7. mcblas<t>nrm2()
2.3.8. mcblas<t>rot()
2.3.9. mcblas<t>rotg()
2.3.10. mcblas<t>rotm()
2.3.11. mcblas<t>rotmg()
2.3.12. mcblas<t>scal()
2.3.13. mcblas<t>swap()
2.4. mcBLAS Level-2函数
2.4.1. mcblas<t>gbmv()
2.4.2. mcblas<t>gemv()
2.4.3. mcblas<t>ger()
2.4.4. mcblas<t>sbmv()
2.4.5. mcblas<t>spmv()
2.4.6. mcblas<t>spr()
2.4.7. mcblas<t>spr2()
2.4.8. mcblas<t>symv()
2.4.9. mcblas<t>syr()
2.4.10. mcblas<t>syr2()
2.4.11. mcblas<t>tbmv()
2.4.12. mcblas<t>tbsv()
2.4.13. mcblas<t>tpmv()
2.4.14. mcblas<t>tpsv()
2.4.15. mcblas<t>trmv()
2.4.16. mcblas<t>trsv()
2.4.17. mcblas<t>hemv()
2.4.18. mcblas<t>hbmv()
2.4.19. mcblas<t>hpmv()
2.4.20. mcblas<t>her()
2.4.21. mcblas<t>her2()
2.4.22. mcblas<t>hpr()
2.4.23. mcblas<t>hpr2()
2.4.24. mcblas<t>gemvBatched()
2.4.25. mcblas<t>gemvStridedBatched()
2.5. mcBLAS Level-3函数
2.5.1. mcblas<t>gemm()
2.5.2. mcblas<t>gemm3m()
2.5.3. mcblas<t>gemmBatched()
2.5.4. mcblas<t>gemmStridedBatched()
2.5.5. mcblas<t>symm()
2.5.6. mcblas<t>syrk()
2.5.7. mcblas<t>syr2k()
2.5.8. mcblas<t>syrkx()
2.5.9. mcblas<t>trmm()
2.5.10. mcblas<t>trsm()
2.5.11. mcblas<t>trsmBatched()
2.5.12. mcblas<t>hemm()
2.5.13. mcblas<t>herk()
2.5.14. mcblas<t>her2k()
2.5.15. mcblas<t>herkx()
2.6. BLAS-Like扩展函数
2.6.1. mcblas<t>geam()
2.6.2. mcblas<t>dgmm()
2.6.3. mcblas<t>getrfBatched()
2.6.4. mcblas<t>getrsBatched()
2.6.5. mcblas<t>getriBatched()
2.6.6. mcblas<t>matinvBatched()
2.6.7. mcblas<t>geqrfBatched()
2.6.8. mcblas<t>gelsBatched()
2.6.9. mcblas<t>tpttr()
2.6.10. mcblas<t>trttp()
2.6.11. mcblas<t>gemmEx()
2.6.12. mcblasGemmEx()
2.6.13. mcblasGemmBatchedEx()
2.6.14. mcblasGemmStridedBatchedEx()
2.6.15. mcblasCsyrkEx()
2.6.16. mcblasCsyrk3mEx()
2.6.17. mcblasCherkEx()
2.6.18. mcblasCherk3mEx()
2.6.19. mcblasNrm2Ex()
2.6.20. mcblasAxpyEx()
2.6.21. mcblasDotEx()
2.6.22. mcblasRotEx()
2.6.23. mcblasScalEx()
曦云系列通用计算GPU mcBLAS API参考
搜索
请启用 JavaScript 以便使用搜索功能