3. 已知问题和使用限制

模块

问题和限制说明

Operator

在划分VF时,dmesg会有error报错: MXCD.EVENT.ERROR Proceess(PID xxxxx) got unhandled exception,send SIGTERM。报错原因是执行unloaddriver时进程没有注册相关的event,由于K8s driver-manager组件只负责驱动管理,并不需要注册事件。因此会出现该错误。该错误不影响功能

对于CentOS系统,绑定VFIO,内核需高于4.18.0-348.el8.x86_64,否则在将VFIO分配给虚拟机时会失败并导致host机器重启

修改device-configmap,将gpu模式修改为sgpu模式,立即删除device pod,可能会遇到operator能同时识别到sgpu和gpu同时存在的情况

SELinux 关闭时,/var/log/metax 目录上下文标签没有清理干净,部署operator,会导致gpu-label启动失败