1. 概述
本文档介绍了沐曦通用GPU EID,旨在帮助开发人员、FAE和系统管理员理解信息具体的含义,以达到分析和解决GPU相关问题的目的。
1.1. 适用产品
本文档适用于沐曦MXC500系列产品:曦云® C500、C500X、C550、C550-PL、C588,曦思® N260,曦索® X206;以及MXC600系列产品:曦云® C600,曦思® N300,曦索® X301、X302。
1.2. 什么是EID消息
EID(Error Message ID)是沐曦GPU上运行 MXMACA® 异构程序的错误报告,打印在系统的内核日志或系统日志中,分为Driver EID和SDK EID。
EID代表发生了常规 GPU 错误,通常是由于MXMACA异构程序错误地对 GPU 进行编程或发送到 GPU 的命令损坏。这些消息可能表示硬件问题、MXMACA平台软件问题或用户在MXMACA平台上开发的应用软件问题。每条消息的含义在MXMACA软件栈版本之间是一致的。
1.3. 如何使用EID消息
EID主要为调试用途。由于许多问题可能有多个可能的根本原因,因此无法仅从 EID 本身提供的信息来了解所有问题。当用户发现问题时,可用mx-report工具来收集所有的日志信息,便于综合分析。