Minimax m2.7适配

link

nuuuuuuke
Members 12 posts

2026年4月16日 16:10 2026年4月16日 16:10
link

modelscope上下载的MiniMax-M2.7-W8A8模型；
镜像用的： :0.14.0-maca.ai3.5.3.102-torch2.8-py310-ubuntu22.04-amd64
c500 单机16卡。
启动命令：
export VLLM_ALLOW_RUNTIME_LORA_UPDATING=True
export MACA_DIRECT_DISPATCH=1
export MACA_GRAPH_LAUNCH_MODE=5
export MACA_SMALL_PAGESIZE_ENABLE=1
export MACA_TORCH_COMPILE_CONF=triton.multi_kernel:1
MODELPATH=/data/opensource-models/MiniMax-M2.7-W8A8-official/
MODEL_NAME=MiniMax-M2.7-W8A8

port=${1:-12001}

currenttime=date "+%Y%m%d%H%M%S"

vllm serve ${MODELPATH} \
--host 0.0.0.0 \
--port ${port} \
--served-model-name ${MODEL_NAME} \
--tensor-parallel-size 16 \
--pipeline-parallel-size 1 \
--dtype half \
--gpu-memory-utilization 0.9 \
--max-num-batched-tokens 8192 \
--max-model-len 8192 \
--swap-space 64 \
--mm-encoder-tp-mode data \
--trust-remote-code \
--max-num-seqs=64 \
--no-enable-prefix-caching --enable-auto-tool-choice --tool-call-parser minimax_m2 --reasoning-parser minimax_m2_append_think \
2>&1 | tee ./${currenttime}.log

报错了。。。。

insert_drive_file

20260416151516.log
Text, 382.3 KB, uploaded by nuuuuuuke on 2026年4月16日.
arrow_forward
Thread has been moved from 产品&运维.
- By shuai_chen on 2026年4月16日 16:13.
link

shuai_chen
Members 384 posts

2026年4月16日 16:15 2026年4月16日 16:15
link

尊敬的开发者您好，modelscope上下载的MiniMax-M2.7-W8A8模型链接麻烦发一下
link

nuuuuuuke
Members 12 posts

2026年4月16日 16:18 2026年4月16日 16:18
link

modelscope.cn/models/metax-tech/MiniMax-M2.7-W8A8
link

shuai_chen
Members 384 posts

2026年4月16日 16:18 2026年4月16日 16:18
link

尊敬的开发者您好，请使用sglang镜像
link

nuuuuuuke
Members 12 posts

2026年4月16日 16:22 2026年4月16日 16:22
link

好吧。。。

image.png
PNG, 429.7 KB, uploaded by nuuuuuuke on 2026年4月16日.
link

nuuuuuuke
Members 12 posts

2026年4月16日 16:34 2026年4月16日 16:34
link

有sglang的推荐启动参数不, 包括各种神秘的环境变量开关。单机16卡C500或者更多
link

shuai_chen
Members 384 posts

2026年4月16日 16:36 2026年4月16日 16:36
link

尊敬的开发者您好，请提供服务器型号
link

nuuuuuuke
Members 12 posts

2026年4月16日 16:43 2026年4月16日 16:43
link

System Info:
Machine ID: 9d52c7d699ca42f0ae1f8b918d2a3eb1
System UUID: b1a64fb0-1ed5-01e1-d311-debf52dba16c
Boot ID: bb311989-725f-4a20-baa7-960a7a0087c9
Kernel Version: 6.8.0-49-generic
OS Image: Ubuntu 24.04.3 LTS
Operating System: linux
Architecture: amd64
Container Runtime Version: containerd://1.7.23
Kubelet Version: v1.31.3-8+52431524cc27b6-sc
Kube-Proxy Version: v1.31.3-8+52431524cc27b6-sc

单机16卡的C500
link

shuai_chen
Members 384 posts

2026年4月16日 16:44 2026年4月16日 16:44
link

尊敬的开发者您好，请提供服务器厂商型号
link

nuuuuuuke
Members 12 posts

2026年4月16日 17:05 2026年4月16日 17:05
link

不知道啊。
link

shuai_chen
Members 384 posts

2026年4月16日 17:06 2026年4月16日 17:06
link

尊敬的开发者您好，请联系服务器厂商商务渠道获取
link

trdyun
Members 5 posts

2026年4月16日 21:27 2026年4月16日 21:27
link

可以参考我的启动脚本，可以正常运行

image.png
PNG, 46.4 KB, uploaded by trdyun on 2026年4月16日.
link

nuuuuuuke
Members 12 posts

2026年4月17日 10:23 2026年4月17日 10:23
link

我没有转vllm的W8A8模型，另外他们有一堆神秘的环境变量，类似这种
export VLLM_ALLOW_RUNTIME_LORA_UPDATING=True
export MACA_DIRECT_DISPATCH=1
export MACA_GRAPH_LAUNCH_MODE=5
export MACA_SMALL_PAGESIZE_ENABLE=1
export MACA_TORCH_COMPILE_CONF=triton.multi_kernel:1
link

trdyun
Members 5 posts

2026年4月17日 10:25 2026年4月17日 10:25
link

我正在使用的就是w8a8的权重，没有额外的环境变量，你可以尝试一下