曦云系列_通用计算GPU_Driver EID Message
目录
1. 背景
2. 概述
3. 日志收集方法
4. METAX常见错误
4.1. METAX-EID-1:ATU Fault
4.2. METAX-EID-2:XCORE Shader Error
4.3. METAX-EID-3:CE Dequeue Timeout
4.4. METAX-EID-4:HBM显存坏页错误
4.5. METAX-EID-5:引用GPU驱动失败
4.6. METAX-EID-6:等待SMP响应超时
4.7. METAX-EID-7:PCIe BAR空间不够
4.8. METAX-EID-8:虚拟地址冲突错误
4.9. METAX-EID-9:HBM显存耗尽
4.10. METAX-EID-10:系统内存耗尽
4.11. METAX-EID-11:INT中断溢出错误
4.12. METAX-EID-12:PCIe AER Error
4.13. METAX-EID-13:PCIe通讯断开
4.14. METAX-EID-14:PCIe syncflood
4.15. METAX-EID-15:RAS Error
5. MXCD常见错误
5.1. MXCD-EID-1:CE Dequeue Error
5.2. MXCD-EID-2:IOCTL操作设备失败
6. MXGVM常见错误
6.1. MXGVM-EID-1:映射GPU卡PCIe BAR失败
6.2. MXGVM-EID-2:GPU卡初始化由于SMP通信超时而失败
6.3. MXGVM-EID-3:GPU卡VBIOS与GPU驱动版本不兼容
6.4. MXGVM-EID-4:GPU卡不支持SRIOV虚拟化
6.5. MXGVM-EID-5:GPU卡SRIOV BAR空间不够
6.6. MXGVM-EID-6:开启GPU卡SRIOV虚拟化失败
6.7. MXGVM-EID-7:GPU卡FLR复位失败
6.8. MXGVM-EID-8:GPU卡PCIe通讯断开
6.9. MXGVM-EID-9:GPU卡ATU Fault
曦云系列_通用计算GPU_Driver EID Message
搜索
请启用 JavaScript 以便使用搜索功能