1. 概述

本文档主要用于指导用户在AI训练的场景下,使用曦云® 系列GPU进行人工智能算法的训练相关事宜。

本文档从MXMACA® 软件栈的维度来介绍曦云系列GPU硬件和配套软件提供的功能特性,指导用户达成对应的使用场景。

1.1. MXMACA软件栈

../_images/image4.png

图 1.1 MXMACA整体架构

在整个MXMACA软件栈中,不可或缺的基础设施是硬件底座。硬件底座提供了算力保证,亦是作为特定场景下面的加速器来使用。

执行规则依托于硬件基础设施,并服务于上层应用。首先是MXMACA的Driver驱动层,对内封装了硬件的基础能力,对外提供了友好的API接口;在驱动层的基础上,进一步满足了不同高级语言的使用范式;此外,提供了针对硬件高度优化的函数库。

1.2. AI训练功能特性

曦云系列GPU支持以下AI训练功能和特性:

  • 支持主流训练框架,如PyTorch、PaddlePaddle等

  • 提供硬件高度适配的高性能算子库,如mcDNN库、mcBLAS库、mcSolverIT库等

  • 提供友好的MXMACA生态用户编程接口

  • 支持分布式训练

  • 支持大模型训练框架

  • 提供完备的工具链

  • 支持容器化部署