MetaX-Tech Developer Forum 论坛首页
  • 沐曦开发者
search
Sign in

shuai_chen

  • Members
  • Joined 2025年6月27日
  • message 帖子
  • forum 主题
  • favorite 关注者
  • favorite_border Follows
  • person_outline 详细信息

shuai_chen has posted 458 messages.

  • See post chevron_right
    shuai_chen
    Members
    模型运行过程中异常终止,且再次重启一直报错无法启动 解决中 2026年5月22日 20:54

    尊敬的开发者您好,请通过GPU购买渠道申请售后支持

  • See post chevron_right
    shuai_chen
    Members
    模型运行过程中异常终止,且再次重启一直报错无法启动 解决中 2026年5月22日 20:39

    尊敬的开发者您好,GPU存在问题,请关机断电,重新插拔。

  • See post chevron_right
    shuai_chen
    Members
    模型运行过程中异常终止,且再次重启一直报错无法启动 解决中 2026年5月22日 20:35

    尊敬的开发者您好,请裸金属执行

    dmesg -T | grep -i err
    
  • See post chevron_right
    shuai_chen
    Members
    模型运行过程中异常终止,且再次重启一直报错无法启动 解决中 2026年5月22日 18:22

    尊敬的开发者您好,请尝试以下命令
    容器内启动命令

    python -m vllm.entrypoints.openai.api_server \
    --model=/xxx/Qwen/Qwen3-32B-AWQ \
    --trust-remote-code \
    --gpu-memory-uti1ization 0.95 \
    --served-model-name "Qwen3-32B"\
    --tensor-parallel-size 1 \
    --max-num-batched-tokens 8192\
    --max-model-1en 8192
    --dtype "bfloat16"\
    --host 0.0.0.0 \
    --port 8000
    
  • See post chevron_right
    shuai_chen
    Members
    metaX C500如何部署bge-m3和bge-reranker-v2-m3模型? 解决中 2026年5月22日 14:49

    尊敬的开发者您好,您两个服务的port一致,请更换尝试

  • See post chevron_right
    shuai_chen
    Members
    模型运行过程中异常终止,且再次重启一直报错无法启动 解决中 2026年5月22日 14:00

    尊敬的开发者您好,请先不使用SGPU,使用整张卡尝试推理。

  • See post chevron_right
    shuai_chen
    Members
    metaX C500如何部署bge-m3和bge-reranker-v2-m3模型? 解决中 2026年5月22日 13:30

    尊敬的开发者您好,请使用沐曦开发者社区镜像中心vLL-MetaX镜像部署developer.metax-tech.com/softnova/docker?chip_name=%E6%9B%A6%E4%BA%91C500%E7%B3%BB%E5%88%97&package_kind=AI&dimension=docker&deliver_type=%E5%88%86%E5%B1%82%E5%8C%85&ai_frame=vllm-metax
    服务启动命令参考vLLM社区文档docs.vllm.ai/en/stable/examples/pooling/embed/
    docs.vllm.ai/en/stable/examples/pooling/score/

  • See post chevron_right
    shuai_chen
    Members
    使用 mx-diagease 工具检测C500 报错显示卡未激活 解决中 2026年5月21日 15:25

    尊敬的开发者您好,是宿主机

  • See post chevron_right
    shuai_chen
    Members
    使用 mx-diagease 工具检测C500 报错显示卡未激活 解决中 2026年5月21日 15:19

    尊敬的开发者您好,请裸金属执行

    dmesg -T | grep -i err
    
  • See post chevron_right
    shuai_chen
    Members
    8卡MetaX C500 部署qwen3.6推理速度太慢 解决中 2026年5月21日 13:43

    尊敬的开发者您好,请服务器关机,拔掉电源线,重新插拔GPU。

  • See post chevron_right
    shuai_chen
    Members
    8卡MetaX C500 部署qwen3.6推理速度太慢 解决中 2026年5月21日 13:36

    尊敬的开发者您好,裸金属执行

    dmesg -T | grep -i err
    
  • See post chevron_right
    shuai_chen
    Members
    Deepseek-V4-Flash量化 解决中 2026年5月21日 11:24

    尊敬的开发者您好,当前镜像不支持DS V4 Flash,请参考developer.metax-tech.com/forum/t/deepseek-v4-flash-liang-hua-bu-shu/468/#post-1959
    部署镜像由于有时效期限制,请开启个人主题获取,右上角倒数第三个图标,收件人写shuai_chen。

  • See post chevron_right
    shuai_chen
    Members
    8卡MetaX C500 部署qwen3.6推理速度太慢 解决中 2026年5月21日 11:10

    尊敬的开发者您好,四卡推理尝试一下

  • See post chevron_right
    shuai_chen
    Members
    8卡MetaX C500 部署qwen3.6推理速度太慢 解决中 2026年5月21日 10:55

    尊敬的开发者您好,请先使用双卡推理尝试

  • See post chevron_right
    shuai_chen
    Members
    8卡MetaX C500 部署qwen3.6推理速度太慢 解决中 2026年5月21日 10:47

    尊敬的开发者您好,请使用双卡推理尝试,删除kv cache参数,C500不支持FP8

  • See post chevron_right
    shuai_chen
    Members
    Deepseek-V4-Flash量化 解决中 2026年5月21日 10:45

    尊敬的开发者您好,请参考developer.metax-tech.com/forum/t/fa-tie-qian-bi-kan-jing-xiang-shi-yong-wen-ti-ti-wen-mo-ban/267/ 详细描述您的操作步骤以及详细日志

  • See post chevron_right
    shuai_chen
    Members
    Deepseek-V4-Flash量化 解决中 2026年5月21日 10:43

    尊敬的开发者您好,请参考developer.metax-tech.com/forum/t/fa-tie-qian-bi-kan-jing-xiang-shi-yong-wen-ti-ti-wen-mo-ban/267/ 详细描述您的操作步骤以及详细日志

  • See post chevron_right
    shuai_chen
    Members
    Deepseek-V4-Flash量化 解决中 2026年5月21日 10:41

    尊敬的开发者您好,请先验证单机八卡是否正常启动

  • 沐曦开发者论坛
powered by misago