在c500上运行Qwen3-14B的模型,用的官方的模型和官方的代码
运行步骤参考使用文档developer.metax-tech.com/doc/242
只改了模型部分,其他部分一模一样,demo中qwen2.5-7B模型可以正常跑而且跑的很快
Qwen3-14B仅能回答1+1之类的简单问题,且提问过程时达到50%的gpu使用率,但是稍长的问题就会卡死不动,gpu占用率为0%,想问一下这个是什么问题
在c500上运行Qwen3-14B的模型,用的官方的模型和官方的代码
运行步骤参考使用文档developer.metax-tech.com/doc/242
只改了模型部分,其他部分一模一样,demo中qwen2.5-7B模型可以正常跑而且跑的很快
Qwen3-14B仅能回答1+1之类的简单问题,且提问过程时达到50%的gpu使用率,但是稍长的问题就会卡死不动,gpu占用率为0%,想问一下这个是什么问题
尊敬的开发者您好,麻烦您提供芯片型号、操作系统、操作系统内核版本、驱动版本、镜像版本以及代码文件上传到附件