7. 已知问题和限制

  1. Warm Reset不能解决服务器硬件故障问题。

  2. Warm Reset不能解决操作系统故障问题。

  3. Warm Reset依赖GPU的一些软硬件功能,在GPU异常的情况下,有可能Warm Reset不能正常执行,需要重启服务器。

  4. 未经测试的服务器可能存在Warm Reset之后丢卡、GPU卡PCIe链路异常、服务器异常重启等现象(参见表 3.1 推荐使用的服务器列表)。

  5. 在同一个互联的GPU卡群组上存在老版本VBIOS(<1.12.0.0)和新版本VBIOS(≧1.12.0.0)的GPU卡混插,会导致老版本GPU卡启动失败,且也无法升级VBIOS,需将MetaXLink断开后才能正常工作。这种情况需要联系沐曦技术支持工程师。

  6. 在同一个互联的GPU卡群组上老版本VBIOS(<1.12.0.0)升级到新版本VBIOS(≧1.12.0.0)时,必须将所有老版本VBIOS的GPU卡的VBIOS全部升级后,才能进行Warm Reset或重启主机的操作,避免出现上述混插场景。

  7. 如果要升级的VBIOS所需的GPU PCIe地址空间比升级前的VBIOS要大(比如bar空间变大,或者从不支持VF的VBIOS升级到支持VF的VBIOS),不能通过Warm Reset使新的VBIOS生效,需要重启服务器。

  8. 如果通过Warm Reset复位GPU卡方式让新VBIOS版本生效,必须保证新版本VBIOS的BAR size配置和旧版本VBIOS的BAR size配置一致。

  9. 支持PF卡Warm Reset,不支持VF卡的Warm Reset。