曦云系列通用计算GPU AI训练用户手册

目录

  • 1. 概述
    • 1.1. MXMACA软件栈
    • 1.2. AI训练功能特性
  • 2. 环境依赖及安装
    • 2.1. 环境依赖
    • 2.2. 获取Docker容器镜像
  • 3. 训练框架的支持
    • 3.1. PyTorch
    • 3.2. PaddlePaddle
    • 3.3. Tensorflow
  • 4. 高性能库
    • 4.1. mcDNN库
    • 4.2. mcBLAS库
    • 4.3. mcSolverIT库
    • 4.4. mcRAND库
    • 4.5. mcFFT库
    • 4.6. mcThrust库
    • 4.7. mcCUB库
  • 5. 用户编程接口
    • 5.1. 编译器接口
    • 5.2. 运行时接口
    • 5.3. 集合通信接口
    • 5.4. 图像处理和视频编解码接口
  • 6. 分布式训练
    • 6.1. 数据并行
    • 6.2. 模型并行
      • 6.2.1. 张量并行
      • 6.2.2. 流水线并行
    • 6.3. 混合并行
  • 7. 大模型训练框架的支持
    • 7.1. Megatron
    • 7.2. DeepSpeed
    • 7.3. Colossal-AI
    • 7.4. InternLM
  • 8. 容器化安装部署
  • 9. 附录
    • 9.1. 术语/缩略语
曦云系列通用计算GPU AI训练用户手册
  • 搜索


© 版权所有 2025 沐曦集成电路(上海)股份有限公司。保留所有权利。