你好,现在使用的mcTracer能打印出kernel的执行时间,但是无法打印kernel在硬件信息的执行流水,类似于数据搬运,kernel加载,kernel执行,这样对于性能优化分析很不友好,请教一下,是否有类似于nv compute的分析工具,可以对算子执行流水进行解析。谢谢。
你好,现在使用的mcTracer能打印出kernel的执行时间,但是无法打印kernel在硬件信息的执行流水,类似于数据搬运,kernel加载,kernel执行,这样对于性能优化分析很不友好,请教一下,是否有类似于nv compute的分析工具,可以对算子执行流水进行解析。谢谢。
尊敬的开发者您好,请您以官方文档为准
mcTracer 是一款与 NVIDIA NSight System 功能相近的系统级时序跟踪与分析工具。如果您需要类似 NSight Compute 的核函数细粒度性能分析功能,建议尝试 mcProfiler,看是否满足您的需求。
另外,关于“算子执行流水”深层次分析功能,目前需通过商务渠道定向申请获取专用工具 cycle-trace。