Posts | shuai_chen | 沐曦开发者论坛

See post chevron_right

shuai_chen
Members

请问曦思N100驱动和压测工具包哪里能下载到解决中 2026年7月10日 16:13

尊敬的开发者您好，曦思N100生命周期已结束，不再维护。若需支持，请通过商务渠道获取。
See post chevron_right

shuai_chen
Members

沐曦C500 卡使用最新版本的SDK3.7.1版本容器镜像无论是sglang还是vllm 引擎启动大模型都非常吃内存解决中 2026年7月10日 15:13

尊敬的开发者您好，感谢您的反馈。请先降级到3.5版本解决。
See post chevron_right

shuai_chen
Members

镜像离线包申請镜像离线包下载申请 2026年7月8日 17:31

尊敬的开发者您好，请通过商务渠道获取
See post chevron_right

shuai_chen
Members

sglang 多卡并行启动大模型服务不管模型大小多小都报内存溢出解决中 2026年7月8日 15:07

尊敬的开发者您好，请使用0.5.9镜像测试
See post chevron_right

shuai_chen
Members

sglang 多卡并行启动大模型服务不管模型大小多小都报内存溢出解决中 2026年7月8日 14:09

尊敬的开发者您好，请在宿主机执行free -h
See post chevron_right

shuai_chen
Members

沐曦对应cuBLAS/cuDNN替代库解决中 2026年7月8日 13:37

尊敬的开发者您好，请参考developer.metax-tech.com/forum/t/fa-tie-qian-bi-kan-jing-xiang-shi-yong-wen-ti-ti-wen-mo-ban/267/ 详细描述
See post chevron_right

shuai_chen
Members

沐曦对应cuBLAS/cuDNN替代库解决中 2026年7月8日 13:31

尊敬的开发者您好，您的输入命令存在换行，请调整为一行
See post chevron_right

shuai_chen
Members

sglang 多卡并行启动大模型服务不管模型大小多小都报内存溢出解决中 2026年7月8日 13:24

尊敬的开发者您好，容器启动docker run添加特权模式尝试
See post chevron_right

shuai_chen
Members

沐曦对应cuBLAS/cuDNN替代库解决中 2026年7月8日 13:09

尊敬的开发者您好，MACA SDK已包含，无需再次安装
See post chevron_right

shuai_chen
Members

sglang 多卡并行启动大模型服务不管模型大小多小都报内存溢出解决中 2026年7月8日 12:10
尊敬的开发者您好，请裸金属执行

cd /opt/maca/samples/mccl_tests/perf bash mccl.sh 2
See post chevron_right

shuai_chen
Members

vllm镜像离线包下载申请已解决 2026年7月8日 11:21

尊敬的开发者您好，离线包已生成developer.metax-tech.com/softnova/docker?chip_name=%E6%9B%A6%E4%BA%91C500%E7%B3%BB%E5%88%97&package_name=vllm-metax:0.18.0-maca.ai3.5.3.405-torch2.8-py310-ubuntu22.04-amd64
See post chevron_right

shuai_chen
Members

sglang 多卡并行启动大模型服务不管模型大小多小都报内存溢出解决中 2026年7月8日 11:10

尊敬的开发者您好，请在两张卡分别指定单卡运行模型。
See post chevron_right

shuai_chen
Members

下载官方镜像报错解决中 2026年7月8日 11:00

尊敬的开发者您好，请按照developer.metax-tech.com/forum/t/mu-xi-kai-fa-zhe-she-qu-jing-xiang-xia-zai-zhong-xin-xin-zeng-jing-xiang-chi-xian-bao-xia-zai-shen-qing-gong-neng/313/ 申请离线包导入
See post chevron_right

shuai_chen
Members

有人成功在vllm上運行gemma4嗎解决中 2026年7月8日 10:45

尊敬的开发者您好，请通过商务渠道获取定制镜像运行，镜像中心镜像暂不支持
See post chevron_right

shuai_chen
Members

sglang 多卡并行启动大模型服务不管模型大小多小都报内存溢出解决中 2026年7月8日 10:41

尊敬的开发者您好，请裸金属执行
dmesg -T | grep -i err
See post chevron_right

shuai_chen
Members

sglang 多卡并行启动大模型服务不管模型大小多小都报内存溢出解决中 2026年7月8日 10:36

尊敬的开发者您好，请使用flashinfer Attention后端尝试
See post chevron_right

shuai_chen
Members

有人成功在vllm上運行gemma4嗎解决中 2026年7月8日 10:34

尊敬的开发者您好，请通过商务渠道获取定制镜像运行
See post chevron_right

shuai_chen
Members

LLAMA.cpp推理框架的适配问题解决中 2026年7月8日 10:32

尊敬的开发者您好，当前没有计划，请关注开发者社区软件中心后续更新