• Members 2 posts
    2025年8月5日 17:03

    我用mcProfiler分析一下chapter3代码中的gpuvectorAdd程序,显示execute failed:local variable 'srvpid' referenced before assignment,请问这个是为什么?

  • Members 28 posts
    2025年8月5日 17:08

    尊敬的开发者您好,麻烦您提供芯片型号、操作系统、操作系统内核版本、驱动版本、Docker版本、镜像名称、容器启动命令、程序启动命令【包含环境变量】以及程序代码【可引用链接】。

  • arrow_forward

    Thread has been moved from 公共.

  • Members 2 posts
    2025年8月5日 17:18

    您好,我的芯片是mxc500,操作系统是Ubuntu2004.6,驱动我也不知道,没使用docker,就是运行了下vectorAdd是正常的,然后使用mcProfiler按照文档里面的填的,执行十几秒之后就error messages:execute failed:local variable 'srvpid' referenced before assignment。强烈建议mcProfiler的使用文档再详细一点,或者录个视频。

  • Members 28 posts
    2025年8月5日 18:45

    尊敬的开发者您好,麻烦您执行一下mx-smi命令,将结果回复。另提供完整的mcProfiler错误日志以及未加mcProfiler的运行日志。

  • Members 13 posts
    2025年8月6日 16:51

    麻烦请教一下,如果mcProfiler远程连接 docker的环境,我这边输入了linux的账号密码(非docker的,ip地址,端口号22),选择了docker及输入docker ContainerName,无反应,是否在账号密码输入的是docker容器的账号密码??如何逐步定位 命令启动失败原因,谢谢。

  • Members 28 posts
    2025年8月6日 16:57

    尊敬的开发者您好,麻烦您在容器内配置ssh服务后重试

  • Members 13 posts
    2025年8月6日 17:04

    你好,那我这边账号密码输入是linux平台的是没有问题的对吧,不需要docker的容器账号密码么?谢谢,我试试看。

  • Members 13 posts
    2025年8月6日 21:12

    麻烦请教一下,使用docker的情况下。 remote port是不是映射到docker22上的linux端口。譬如8080->22 那填写的是8080?这里的remote user 和password是linux的还是docker的? 我目前用的都是docker的ip,username 和passwd,port是linux的映射端口。
    看日志的话,有报错如下:2025-08-06 21:01:52,803 INFO paramiko.transport: Authentication (publickey) failed.
    2025-08-06 21:01:52,803 DEBUG paramiko.transport: userauth is OK
    2025-08-06 21:01:52,852 INFO paramiko.transport: Authentication (password) successful!
    2025-08-06 21:01:52,880 DEBUG paramiko.transport: Debug msg: b'Ignored authorized keys: bad ownership or modes for file /root/.ssh/authorized_keys'
    2025-08-06 21:01:52,959 DEBUG paramiko.transport: Dropping user packet because connection is dead.
    2025-08-06 21:01:52,959 DEBUG paramiko.transport: Dropping user packet because connection is dead. 麻烦帮看看,谢谢。

  • Members 28 posts
    2025年8月7日 11:28

    尊敬的开发者您好:
    使用docker的情况下。 remote port是不是映射到docker22上的linux端口。譬如8080->22 那填写的就是8080。注意宿主机防火墙开放此端口。
    remote user 和password是docker的。请先用ssh工具确保容器内ssh可以成功连接。

  • Members 13 posts
    2025年8月7日 11:52

    感谢,应该是我理解错误,这里不需要选额外的docker选项了。还有一个问题请教,跑完以后,数据返回貌似失败。我这边请求已经跑完了。但是数据返回失败。
    [warning] cannot get rpc server port, try more times:cannot retrieve rpc server port.
    mcRpcPort.ini: ['cat: /root/mcRpcPort.ini: No such file or directory']
    [warning] cannot get rpc server port, try more times:cannot retrieve rpc server port.
    [error] cannot connect to server:
    [error] execute failed:
    [error] Traceback (most recent call last):
    File "prpc_client\mctool_client.py", line 36, in init
    File "grpc_utilities.py", line 151, in result
    File "grpc_utilities.py", line 97, in _block
    grpc.FutureTimeoutError

    During handling of the above exception, another exception occurred:

    Traceback (most recent call last):
    File "phttp\server_backend.py", line 649, in perf_exec
    File "phttp\server_backend.py", line 566, in _perf_exec
    File "phttp\server_backend.py", line 523, in perf_run
    File "prpc_client\mctool_client.py", line 40, in init
    Exception

  • Members 28 posts
    2025年8月7日 12:44

    尊敬的开发者您好,日志显示服务连接失败。请先确保ssh工具可以连接到服务器,确保ssh服务连接正常。

  • Members 13 posts
    2025年8月7日 12:46

    我这边用mcprofiler都已经看到连接成功,在docker里面跑模型的日志也在profile的日志文件中答应出来了。为什么说服务失败。

  • Members 28 posts
    2025年8月7日 12:52

    尊敬的开发者您好,日志显示RPC服务失败,请检查RPC状态。
    [warning] cannot get rpc server port, try more times:cannot retrieve rpc server port.
    mcRpcPort.ini: ['cat: /root/mcRpcPort.ini: No such file or directory']
    [warning] cannot get rpc server port, try more times:cannot retrieve rpc server port.
    [error] cannot connect to server:

  • Members 28 posts
    2025年8月7日 12:55

    尊敬的开发者,请先阅读以下内容:
    mcProfiler主要通过在Windows上执行可视化+Linux上执行实际采样的方式进行作业,方便用户直接使用mcProfiler进行可视化调优。考虑到跨平台的兼容性问题,需要满足以下前置条件:
    Windows GUI客户端所在的平台,简称为GUI平台:需要对应的网络权限。建议针对GUI程序关闭防火墙拦截。
    MXMACA程序所在的Linux平台,简称为MXMACA平台:需要开放对应的SSH权限。若使用私钥登录,需要确保用户目录权限(通常为700)以及对应的公钥文件权限(通常为600)正确。
    对于被度量的目标程序,需要链接 libmcToolsExt.so 动态库(跟随MXMACA软件包默认安装)以启动调试支持。用户可以在编译目标程序时加上 -lmcToolsExt 链接选项进行链接。
    参考链接:developer.metax-tech.com/api/client/document/preview/545/index.html

  • Members 13 posts
    2025年8月7日 12:56

    好的。我这边检查一下防火墙拦截。别的两个和我这里没有关系。感谢。还有请教一下,现在除了mcprofiler工具,mx是否还有别的profiling工具,例如支持muxi支持的 推理引擎vllm上的性能分析。

  • Members 28 posts
    2025年8月7日 13:03

    尊敬的开发者您好,请提供完整的操作截图以及相关日志文件。

  • Members 28 posts
    2025年8月7日 13:21

    尊敬的开发者您好,
    mcTracer主要抓取MXMACA应用程序的活动事件,并将活动事件按照时间序列进行展示。
    mcTracer分为两部分,分别是用于采集数据的采样端程序 mcTracer,以及用于显示活动序列的 mcTracer-Viewer。
    支持抓取的数据类型包括:
    MXMACA Runtime API,主要是MXMACA软件栈提供的API活动
    MXMACA Kernel,运行在曦云系列GPU上的核函数
    MCTX,自定义标签段数据
    参考链接:developer.metax-tech.com/api/client/document/preview/548/C500_mcTracerManual_CN.html

  • Members 13 posts
    2025年8月7日 15:52

    Task Menu下面Ex cute Loop 0我这边看到的有在docker里面执行模型的命令,且模型执行成功。但是还是一样的报错。如果有防火墙,这个数据应该无法返回。我这边已经确认把gui-profiler加到百名店白名单里面

    1.在server日志文件里面,我看到了模型推理过程日志以及结果的打印日志。mcRpcPort.ini: ['cat: /root/mcRpcPort.ini: No such file or directory']这个是需要手动修改还是需要额外启动RPC服务?如何启动

    [warning] cannot get rpc server port, try more times:cannot retrieve rpc server port.
    mcRpcPort.ini: ['cat: /root/mcRpcPort.ini: No such file or directory']
    [warning] cannot get rpc server port, try more times:cannot retrieve rpc server port.
    mcToolsExtPid_UsedPort:10466-46153
    mcRpcPort.ini: ['10466,46153,python3.10']
    [info] mctool client port:46153
    INFO 08-07 15:32:15 [parallel_state.py:1004] rank 0 in world size 1 is assigned as DP rank 0, PP rank 0, TP rank 0
    INFO 08-07 15:32:15 [cuda.py:204] Using FlashMLA backend on V1 engine.
    WARNING 08-07 15:32:15 [topk_topp_sampler.py:69] FlashInfer is not available. Falling back to the PyTorch-native implementation of top-p & top-k sampling. For the best performance, please install FlashInfer.
    INFO 08-07 15:32:16 [gpu_model_runner.py:1329] Starting to load model /home/weight/DeepSeek-V2-Lite...
    Loading safetensors checkpoint shards: 0% Completed | 0/4 [00:00<?, ?it/s]
    Loading safetensors checkpoint shards: 25% Completed | 1/4 [00:04<00:12, 4.27s/it]
    Loading safetensors checkpoint shards: 50% Completed | 2/4 [00:07<00:07, 3.54s/it]
    Loading safetensors checkpoint shards: 75% Completed | 3/4 [00:11<00:04, 4.02s/it]
    [error] cannot connect to server:
    [error] execute failed:
    [error] Traceback (most recent call last):
    File "prpc_client\mctool_client.py", line 36, in init
    File "grpc_utilities.py", line 151, in result
    File "grpc_utilities.py", line 97, in _block
    grpc.FutureTimeoutError

    麻烦再帮看看,谢谢。3