Threads | ruanding | 沐曦开发者论坛

See post chevron_right

ruanding
Members

GLM-5和Qwen3.5系类模型适配已解决 2026年3月23日 14:30

您好，近日看到有发文显示GLM-5和Qwen3.5系列大模型可以沐曦曦云C500 GPU上运行，请问应该用什么推理软件？因为我看当前提供的arm版vLLM还是0.11版本，不支持运行这两个系列的模型

沐曦股份曦云C系列GPU 完成通义千问Qwen 3.5 Day 0 适配 has written:

www.metax-tech.com/ndetail/12563.html

沐曦股份曦云C系列GPU 完成通义千问Qwen 3.5 Day 0 适配 has written:

mp.weixin.qq.com/s?__biz=Mzg5NzY1MDM3Mg==&mid=2247492553&idx=1&sn=0b9d5ee19095dc670e99d44959fe8c5e&scene=21&poc_token=HFu0wGmjU8FwnYY90l7ZxEprwuD7m6MHf7bH0FCH
See post chevron_right

ruanding
Members

沐曦卡运行siglip模型性能问题已解决 2026年2月9日 10:14

本人使用鲲鹏920新型号CPU+一张曦云C500 NPU，运行siglip模型。对于同一张图片，在裸机上使用纯CPU上推理时延约1037ms，但是使用NPU推理时延约2837ms，在容器（maca-torch2.4-py310-mc3.3.0.4-kylinv10-arm64）内使用NPU推理时延约2616ms；但使用英伟达4090推理时延约310ms。使用NPU推理的性能弱于使用CPU推理，这性能明显不正常，请问该如何排查和解决？其中驱动版本是3.5.3.11，sdk版本是3.5.3.17，cu-bridge用的是master分支代码。
See post chevron_right

ruanding
Members

沐曦版pytorch安装问题已解决 2026年2月3日 21:27

我下载了maca-pytorch2.8-py312-3.5.3.9-aarch64.tar这个版本的安装包后，在裸机上创建conda环境并安装了pytorch等安装包后导入pytorch时有如下报错File "<stdin>", line 1, in <module>
File "/home/lv/miniconda3/envs/python312/lib/python3.12/site-packages/torch/init.py", line 421, in <module>
from torch._C import * # noqa: F403
^^^^^^^^^^^^^^^^^^^^^^
ImportError: libmxomp.so: cannot open shared object file: No such file or directory
请问该如何解决？我已经安装了2.14.27版本的驱动和2.32.0.9版本的MACA sdk。
See post chevron_right

ruanding
Members

无法采集profiler数据或timeline 已解决 2025年12月18日 14:24

您好，我在使用容器中的vllm0.8.2部署大模型进行推理时，无法采集profiler数据——设置VLLM_TORCH_PROFILER_DIR环境变量后会卡死。请问该如何解决？