MetaX-Tech Developer Forum 论坛首页
  • 沐曦开发者
search
Sign in
  • chevron_right Threads
  • label 产品&运维
  • label 已解决

求助模型量化镜像或软件

lvby
2026年1月29日
chat_bubble_outline 6
  • link
    lvby
    Members 8 posts
    2026年1月29日 15:35 2026年1月29日 15:35
    link

    您好,
    由于在沐曦镜像中无法直接安装官方版本的llmcompressor,想问一下如何在沐曦GPU上进行BF16到W8A8的模型量化,感谢!

  • link
    shuai_chen
    Members 221 posts
    2026年2月2日 15:51 2026年2月2日 15:51
    link

    尊敬的开发者您好,请提供具体的模型名称以及链接。

  • arrow_forward

    Thread has been moved from 公共.

    • By shuai_chen on 2026年2月2日 16:00.
  • link
    lvby
    Members 8 posts
    2026年2月2日 16:38 2026年2月2日 16:38
    link

    感谢回复,
    modelscope上有沐曦上传的一些量化模型,但是不能覆盖全部需求,所以希望获取到量化工具
    目前的需求是ERNIE-4.5-300B-A47B这个模型,下载链接:modelscope.cn/models/PaddlePaddle/ERNIE-4.5-300B-A47B-PT

  • link
    shuai_chen
    Members 221 posts
    2026年2月2日 16:41 2026年2月2日 16:41
    link

    尊敬的开发者您好,您是用哪个框架进行推理。

  • link
    lvby
    Members 8 posts
    2026年2月2日 17:01 2026年2月2日 17:01
    link

    vllm或者sglang都可以,请问在沐曦平台上这两个推理引擎支持的量化格式有区别吗?

  • link
    shuai_chen
    Members 221 posts
    2026年2月2日 17:05 2026年2月2日 17:05
    link

    尊敬的开发者您好,vllm和sglang量化脚本不同,生成量化后的权重也不同,不能互用。量化方式请联系相关商务接口人申请技术支持!

  • link
    lvby
    Members 8 posts
    2026年2月6日 08:59 2026年2月6日 08:59
    link

    好的 感谢

  • arrow_forward

    Thread has been moved from 解决中.

    • By shuai_chen on 2026年2月11日 14:38.
arrow_upward Go to top
  • 沐曦开发者论坛
powered by misago