1. 概述
mx-diagease(沐曦一键诊断工具)主要提供对单节点沐曦通用GPU设备进行一键诊断的功能,诊断包括PCIe诊断,MetaXLink诊断(如有),内存诊断,电源功耗诊断和GPU压测。
mx-diagease还提供了一种辅助监控模式,工具在该模式下将持续收集多个电源及功耗相关数据,方便用户监测相关指标是否存在异常。
备注
在使用mx-diagease工具之前,需确认已加载沐曦通用GPU驱动。驱动安装参见《沐曦通用GPU 驱动安装指南》中“安装驱动”章节。
一键诊断时,请确保诊断程序单独运行在设备上,避免其他进程对诊断结果造成影响。可用
mx-smi –show-all-process查看是否有用户进程。mx-diagease工具目前不支持对虚拟化后的沐曦通用GPU进行检测,也不支持sGPU切分后进行检测。
本文档中,输出结果均以曦云C500为示例。
1.1. 适用产品
本文档适用于沐曦MXC500系列产品:曦云® C500、C500X、C550、C550-PL、C588,曦思® N260,曦索® X206;以及MXC600系列产品:曦云® C600,曦思® N300,曦索® X301、X302。