曦云系列通用GPU AI训练用户手册
1. 概述
1.1. MXMACA软件栈
1.2. AI训练功能特性
2. 环境依赖及安装
2.1. 环境依赖
2.2. 获取Docker容器镜像
3. 训练框架的支持
3.1. PyTorch
3.2. PaddlePaddle
3.3. Tensorflow
4. 高性能库
4.1. mcDNN库
4.2. mcBLAS库
4.3. mcSolverIT库
4.4. mcRAND库
4.5. mcFFT库
4.6. mcThrust库
4.7. mcCUB库
5. 用户编程接口
5.1. 编译器接口
5.2. 运行时接口
5.3. 集合通信接口
5.4. 图像处理和视频编解码接口
6. 分布式训练
6.1. 数据并行
6.2. 模型并行
6.2.1. 张量并行
6.2.2. 流水线并行
6.3. 混合并行
7. 大模型训练框架的支持
7.1. Megatron
7.2. DeepSpeed
7.3. Colossal-AI
7.4. InternLM
8. 容器化安装部署
9. 附录
9.1. 术语/缩略语
曦云系列通用GPU AI训练用户手册
目录
下一页
目录
1. 概述
1.1. MXMACA软件栈
1.2. AI训练功能特性
2. 环境依赖及安装
2.1. 环境依赖
2.2. 获取Docker容器镜像
3. 训练框架的支持
3.1. PyTorch
3.2. PaddlePaddle
3.3. Tensorflow
4. 高性能库
4.1. mcDNN库
4.2. mcBLAS库
4.3. mcSolverIT库
4.4. mcRAND库
4.5. mcFFT库
4.6. mcThrust库
4.7. mcCUB库
5. 用户编程接口
5.1. 编译器接口
5.2. 运行时接口
5.3. 集合通信接口
5.4. 图像处理和视频编解码接口
6. 分布式训练
6.1. 数据并行
6.2. 模型并行
6.2.1. 张量并行
6.2.2. 流水线并行
6.3. 混合并行
7. 大模型训练框架的支持
7.1. Megatron
7.2. DeepSpeed
7.3. Colossal-AI
7.4. InternLM
8. 容器化安装部署
9. 附录
9.1. 术语/缩略语