1. 概述
本文档介绍了曦云®系列GPU EID,旨在帮助开发人员、FAE和系统管理员理解信息具体的含义,以达到分析和解决GPU相关问题的目的。
1.1. 什么是EID消息
EID(Error Message ID)是沐曦GPU上运行 MXMACA® 异构程序的错误报告,打印在系统的内核日志或系统日志中,分为Driver EID和SDK EID。
EID代表发生了常规 GPU 错误,通常是由于MXMACA异构程序错误地对 GPU 进行编程或发送到 GPU 的命令损坏。这些消息可能表示硬件问题、MXMACA平台软件问题或用户在MXMACA平台上开发的应用软件问题。每条消息的含义在MXMACA软件栈版本之间是一致的。
1.2. 如何使用EID消息
EID主要为调试用途。由于许多问题可能有多个可能的根本原因,因此无法仅从 EID 本身提供的信息来了解所有问题。当用户发现问题时,可用mx-report工具来收集所有的日志信息,便于综合分析。