• Members 16 posts
    2025年9月17日 17:40

    你好,现在使用的mcTracer能打印出kernel的执行时间,但是无法打印kernel在硬件信息的执行流水,类似于数据搬运,kernel加载,kernel执行,这样对于性能优化分析很不友好,请教一下,是否有类似于nv compute的分析工具,可以对算子执行流水进行解析。谢谢。

  • Members 60 posts
    2025年9月17日 17:50

    尊敬的开发者您好,请您以官方文档为准

  • Members 7 posts
    2025年9月21日 11:36

    mcTracer 是一款与 NVIDIA NSight System 功能相近的系统级时序跟踪与分析工具。如果您需要类似 NSight Compute 的核函数细粒度性能分析功能,建议尝试 mcProfiler,看是否满足您的需求。
    另外,关于“算子执行流水”深层次分析功能,目前需通过商务渠道定向申请获取专用工具 cycle-trace。