1. 概述

本文档介绍了沐曦通用GPU EID,旨在帮助开发人员、FAE和系统管理员理解信息具体的含义,以达到分析和解决GPU相关问题的目的。

1.1. 适用产品

本文档适用于沐曦MXC500系列产品:曦云® C500、C500X、C550、C550-PL、C588,曦思® N260,曦索® X206;以及MXC600系列产品:曦云® C600,曦思® N300,曦索® X301、X302。

1.2. 什么是EID消息

EID(Error Message ID)是沐曦GPU上运行 MXMACA® 异构程序的错误报告,打印在系统的内核日志或系统日志中,分为Driver EID和SDK EID。

EID代表发生了常规 GPU 错误,通常是由于MXMACA异构程序错误地对 GPU 进行编程或发送到 GPU 的命令损坏。这些消息可能表示硬件问题、MXMACA平台软件问题或用户在MXMACA平台上开发的应用软件问题。每条消息的含义在MXMACA软件栈版本之间是一致的。

1.3. 如何使用EID消息

EID主要为调试用途。由于许多问题可能有多个可能的根本原因,因此无法仅从 EID 本身提供的信息来了解所有问题。当用户发现问题时,可用mx-report工具来收集所有的日志信息,便于综合分析。