1. 概述
本文档主要用于指导用户在AI训练的场景下,使用曦云® 系列GPU进行人工智能算法的训练相关事宜。
本文档从MXMACA® 软件栈的维度来介绍曦云系列GPU硬件和配套软件提供的功能特性,指导用户达成对应的使用场景。
1.1. MXMACA软件栈
图 1.1 MXMACA整体架构
在整个MXMACA软件栈中,不可或缺的基础设施是硬件底座。硬件底座提供了算力保证,亦是作为特定场景下面的加速器来使用。
执行规则依托于硬件基础设施,并服务于上层应用。首先是MXMACA的Driver驱动层,对内封装了硬件的基础能力,对外提供了友好的API接口;在驱动层的基础上,进一步满足了不同高级语言的使用范式;此外,提供了针对硬件高度优化的函数库。
1.2. AI训练功能特性
曦云系列GPU支持以下AI训练功能和特性:
支持主流训练框架,如PyTorch、PaddlePaddle等
提供硬件高度适配的高性能算子库,如mcDNN库、mcBLAS库、mcSolverIT库等
提供友好的MXMACA生态用户编程接口
支持分布式训练
支持大模型训练框架
提供完备的工具链
支持容器化部署