MetaX-Tech Developer Forum 论坛首页
  • 沐曦开发者
search
Sign in
  • chevron_right Threads
  • label 产品&运维
  • label 解决中

Minimax m2.7适配

nuuuuuuke
2026年4月16日
chat_bubble_outline 13
  • link
    nuuuuuuke
    Members 12 posts
    2026年4月16日 16:10 2026年4月16日 16:10
    link

    modelscope上下载的MiniMax-M2.7-W8A8模型;
    镜像用的: :0.14.0-maca.ai3.5.3.102-torch2.8-py310-ubuntu22.04-amd64
    c500 单机16卡。
    启动命令:
    export VLLM_ALLOW_RUNTIME_LORA_UPDATING=True
    export MACA_DIRECT_DISPATCH=1
    export MACA_GRAPH_LAUNCH_MODE=5
    export MACA_SMALL_PAGESIZE_ENABLE=1
    export MACA_TORCH_COMPILE_CONF=triton.multi_kernel:1
    MODELPATH=/data/opensource-models/MiniMax-M2.7-W8A8-official/
    MODEL_NAME=MiniMax-M2.7-W8A8

    port=${1:-12001}

    currenttime=date "+%Y%m%d%H%M%S"

    vllm serve ${MODELPATH} \
    --host 0.0.0.0 \
    --port ${port} \
    --served-model-name ${MODEL_NAME} \
    --tensor-parallel-size 16 \
    --pipeline-parallel-size 1 \
    --dtype half \
    --gpu-memory-utilization 0.9 \
    --max-num-batched-tokens 8192 \
    --max-model-len 8192 \
    --swap-space 64 \
    --mm-encoder-tp-mode data \
    --trust-remote-code \
    --max-num-seqs=64 \
    --no-enable-prefix-caching --enable-auto-tool-choice --tool-call-parser minimax_m2 --reasoning-parser minimax_m2_append_think \
    2>&1 | tee ./${currenttime}.log

    报错了。。。。

    insert_drive_file
    20260416151516.log

    Text, 382.3 KB, uploaded by nuuuuuuke on 2026年4月16日.

  • arrow_forward

    Thread has been moved from 产品&运维.

    • By shuai_chen on 2026年4月16日 16:13.
  • link
    shuai_chen
    Members 384 posts
    2026年4月16日 16:15 2026年4月16日 16:15
    link

    尊敬的开发者您好,modelscope上下载的MiniMax-M2.7-W8A8模型链接麻烦发一下

  • link
    nuuuuuuke
    Members 12 posts
    2026年4月16日 16:18 2026年4月16日 16:18
    link

    modelscope.cn/models/metax-tech/MiniMax-M2.7-W8A8

  • link
    shuai_chen
    Members 384 posts
    2026年4月16日 16:18 2026年4月16日 16:18
    link

    尊敬的开发者您好,请使用sglang镜像

  • link
    nuuuuuuke
    Members 12 posts
    2026年4月16日 16:22 2026年4月16日 16:22
    link

    好吧。。。

    image.png

    PNG, 429.7 KB, uploaded by nuuuuuuke on 2026年4月16日.

  • link
    nuuuuuuke
    Members 12 posts
    2026年4月16日 16:34 2026年4月16日 16:34
    link

    有sglang的推荐启动参数不, 包括各种神秘的环境变量开关。 单机16卡C500或者更多

  • link
    shuai_chen
    Members 384 posts
    2026年4月16日 16:36 2026年4月16日 16:36
    link

    尊敬的开发者您好,请提供服务器型号

  • link
    nuuuuuuke
    Members 12 posts
    2026年4月16日 16:43 2026年4月16日 16:43
    link

    System Info:
    Machine ID: 9d52c7d699ca42f0ae1f8b918d2a3eb1
    System UUID: b1a64fb0-1ed5-01e1-d311-debf52dba16c
    Boot ID: bb311989-725f-4a20-baa7-960a7a0087c9
    Kernel Version: 6.8.0-49-generic
    OS Image: Ubuntu 24.04.3 LTS
    Operating System: linux
    Architecture: amd64
    Container Runtime Version: containerd://1.7.23
    Kubelet Version: v1.31.3-8+52431524cc27b6-sc
    Kube-Proxy Version: v1.31.3-8+52431524cc27b6-sc

    单机16卡的C500

  • link
    shuai_chen
    Members 384 posts
    2026年4月16日 16:44 2026年4月16日 16:44
    link

    尊敬的开发者您好,请提供服务器厂商型号

  • link
    nuuuuuuke
    Members 12 posts
    2026年4月16日 17:05 2026年4月16日 17:05
    link

    不知道啊。

  • link
    shuai_chen
    Members 384 posts
    2026年4月16日 17:06 2026年4月16日 17:06
    link

    尊敬的开发者您好,请联系服务器厂商商务渠道获取

  • link
    trdyun
    Members 5 posts
    2026年4月16日 21:27 2026年4月16日 21:27
    link

    可以参考我的启动脚本,可以正常运行

    image.png

    PNG, 46.4 KB, uploaded by trdyun on 2026年4月16日.

  • link
    nuuuuuuke
    Members 12 posts
    2026年4月17日 10:23 2026年4月17日 10:23
    link

    我没有转vllm的W8A8模型, 另外他们有一堆神秘的环境变量,类似这种
    export VLLM_ALLOW_RUNTIME_LORA_UPDATING=True
    export MACA_DIRECT_DISPATCH=1
    export MACA_GRAPH_LAUNCH_MODE=5
    export MACA_SMALL_PAGESIZE_ENABLE=1
    export MACA_TORCH_COMPILE_CONF=triton.multi_kernel:1

  • link
    trdyun
    Members 5 posts
    2026年4月17日 10:25 2026年4月17日 10:25
    link

    我正在使用的就是w8a8的权重,没有额外的环境变量,你可以尝试一下

arrow_upward Go to top
  • 沐曦开发者论坛
powered by misago