MetaX-Tech Developer Forum 论坛首页
  • 沐曦开发者
search
Sign in

zhangjc

  • Members
  • Joined 2026年3月13日
  • message 帖子
  • forum 主题
  • favorite 关注者
  • favorite_border Follows
  • person_outline 详细信息

zhangjc has posted 6 messages.

  • See post chevron_right
    zhangjc
    Members
    metax-mx-exporter采集到的mx_memory_used 一直是一个固定值 已解决 2026年3月26日 18:45

    环境重装了, 等重装后复现我再回复

  • See post chevron_right
    zhangjc
    Members
    metax-mx-exporter采集到的mx_memory_used 一直是一个固定值 已解决 2026年3月25日 15:22

    如图所示,在这里下载的的离线包,然后解压后,进入mx-exporter/deployment/mx-exporter/helm 然后执行
    helm upgrade --install mx-exporter -n cybertron-monitor ./mx-exporter

  • See post chevron_right
    zhangjc
    Members
    metax-mx-exporter采集到的mx_memory_used 一直是一个固定值 已解决 2026年3月25日 14:52

    在一个单节点的k8s环境helm 部署的mx-exporter,通过servicemonitor对接Prometheus
    环境里两张卡,无论哪张卡起训练任务,从exporter metres 接口拿到的数据,id=0的卡的显存使用始终等于id=1的卡的显存

  • See post chevron_right
    zhangjc
    Members
    metax-mx-exporter采集到的mx_memory_used 一直是一个固定值 已解决 2026年3月24日 14:13

    好的,目前遇到的最新问题,用id=1的卡起训练任务,id=0的卡,显存利用率上报的和id=1的一样

  • See post chevron_right
    zhangjc
    Members
    metax-mx-exporter采集到的mx_memory_used 一直是一个固定值 已解决 2026年3月23日 18:19

    MX-SMI 2.2.12
    Kernel Mode Driver Version: 3.3.12
    MACA Version: Unkonws

  • See post chevron_right
    zhangjc
    Members
    K8S安装问题 已解决 2026年3月13日 14:17

    哈哈,怎么解决的,同问

  • 沐曦开发者论坛
powered by misago