MetaX-Tech Developer Forum 论坛首页
  • 沐曦开发者
search
Sign in

ruanding

  • Members
  • Joined 2025年12月18日
  • message 帖子
  • forum 主题
  • favorite 关注者
  • favorite_border Follows
  • person_outline 详细信息

ruanding has started 3 threads.

  • See post chevron_right
    ruanding
    Members
    沐曦卡运行siglip模型性能问题 解决中 2026年2月9日 10:14

    本人使用鲲鹏920新型号CPU+一张曦云C500 NPU,运行siglip模型。对于同一张图片,在裸机上使用纯CPU上推理时延约1037ms,但是使用NPU推理时延约2837ms,在容器(maca-torch2.4-py310-mc3.3.0.4-kylinv10-arm64)内使用NPU推理时延约2616ms;但使用英伟达4090推理时延约310ms。使用NPU推理的性能弱于使用CPU推理,这性能明显不正常,请问该如何排查和解决?其中驱动版本是3.5.3.11,sdk版本是3.5.3.17,cu-bridge用的是master分支代码。

  • See post chevron_right
    ruanding
    Members
    沐曦版pytorch安装问题 解决中 2026年2月3日 21:27

    我下载了maca-pytorch2.8-py312-3.5.3.9-aarch64.tar这个版本的安装包后,在裸机上创建conda环境并安装了pytorch等安装包后导入pytorch时有如下报错File "<stdin>", line 1, in <module>
    File "/home/lv/miniconda3/envs/python312/lib/python3.12/site-packages/torch/init.py", line 421, in <module>
    from torch._C import * # noqa: F403
    ^^^^^^^^^^^^^^^^^^^^^^
    ImportError: libmxomp.so: cannot open shared object file: No such file or directory
    请问该如何解决?我已经安装了2.14.27版本的驱动和2.32.0.9版本的MACA sdk。

  • See post chevron_right
    ruanding
    Members
    无法采集profiler数据或timeline 已解决 2025年12月18日 14:24

    您好,我在使用容器中的vllm0.8.2部署大模型进行推理时,无法采集profiler数据——设置VLLM_TORCH_PROFILER_DIR环境变量后会卡死。请问该如何解决?

  • 沐曦开发者论坛
powered by misago