1. 概述

本文档详细描述了如何在曦云® 系列的GPU硬件上使用MXMACA软件栈进行编程,旨在帮助开发人员利用曦云系列GPU提供的计算资源,快速构建自己的应用。

曦云系列GPU的整体系统架构如图 1.1 所示:

../_images/figure_1_1.png

图 1.1 系统架构

MXMACA® (MetaX Advanced Compute Architecture)是采用通用并行计算架构解决复杂计算问题的异构计算平台,包含了指令集架构(ISA)、GPU并行计算硬件引擎和GPU软件开发平台。 它提供了规范化的编程接口,包括MXMACA驱动层提供的运行时API、MXMACA语言层提供的类C/C++编程语言、MXMACA库封装层提供的人工智能和计算加速库,方便用户编写MXMACA程序,使其在GPU处理器上以超高性能运行。

本文档主要介绍MXMACA驱动层提供的运行时API,它提供了分配和释放设备内存、在主机内存和设备内存之间传输数据、调度和启动GPU内核任务、管理具有多个设备的系统等功能。