求助CUDA中插入ptx的替代方法

link

lvby
Members 9 posts

2026年1月16日 10:33 2026年1月16日 10:33
link

你好，
我注意到沐曦编程目前不支持插入内联汇编，我想知道是否有办法实现类似的功能。比如带st.release.sys.global和st.acquire.sys.global这样的语义在沐曦平台上该如何实现呢？

感谢
link

shuai_chen
Members 314 posts

2026年1月16日 11:03 2026年1月16日 11:03
link

尊敬的开发者您好，请联系相关商务接口人。
arrow_forward
Thread has been moved from 公共.
- By shuai_chen on 2026年1月16日 11:13.
arrow_forward
Thread has been moved from 解决中.
- By shuai_chen on 2026年1月19日 14:47.
link

lvby
Members 9 posts

2026年1月22日 20:36 2026年1月22日 20:36
link

还有一个关于多进程并发内存一致性的问题想请教：
在 GPU0 的 kernel 中，希望等待 GPU1 对某个内存位置完成写入，即 GPU0 不断轮询（读取） global memory 上的某个地址，直到 GPU1 写入完成。
从我的测试结果来看，现有的内存一致性模型似乎并不支持这种跨 GPU 的同步方式？文档里面好像没有这方面的介绍，有什么好的方法可以实现GPU之间的同步吗。
link

shuai_chen
Members 314 posts

2026年1月23日 10:49 2026年1月23日 10:49
link

尊敬的开发者您好，请参考gitee.com/metax-maca/cu-bridge/blob/master/docs/02_User_Manual/
link

lvby
Members 9 posts

2026年1月26日 10:16 2026年1月26日 10:16
link

感谢您回复，我尝试用ptx2cpp把ptx转成c++代码，但是还是无法工作。
我的场景是使用内存栅栏进行多GPU同步，GPU0上的kernel需要写入GPU1的内存(指针通过IPC handler获取)，然后GPU1在kernel内检查到写入。ptx2cpp的建议是使用__threadfence(文档也是如此建议的)，并且使用volatile修饰对应的指针，但是尝试后仍然无法在GPU1的kernel中读到写入(kernel结束后检查结果可以看到写入)。
由于沐曦并没有开源通信库相关的代码，想请教一下跨GPU的可见写入是如何实现的。
link

shuai_chen
Members 314 posts

2026年1月26日 10:45 2026年1月26日 10:45
link

尊敬的开发者您好，请联系相关商务接口人。
arrow_forward
Thread has been moved from 已解决.
- By shuai_chen on 2026年1月26日 11:07.
arrow_forward
Thread has been moved from 解决中.
- By shuai_chen on 2026年2月2日 16:02.
link

aaron
Members 9 posts

2026年2月4日 14:13 2026年2月4日 14:13
link

我遇到了相同的问题，请问该问题解决了吗
link

lvby
Members 9 posts

2026年2月6日 08:51 2026年2月6日 08:51
link

没解决，这个暂时搁置了。
link

shuai_chen
Members 314 posts

2026年2月11日 14:18 2026年2月11日 14:18
link

尊敬的开发者您好，请联系相关商务接口人申请技术支持
link

Yang_Yang
Members 8 posts

2026年3月26日 15:35 2026年3月26日 15:35
link

尊敬的开发者您好，NVIDIA 的软件最终用户许可协议（EULA）第1.2章第8条中限制对SDK的输出进行反向工程、反编译、反汇编以适配到非NVIDIA平台上的行为，沐曦软硬件产品亦无直接兼容PTX的功能。如您明确要实现的具体功能，请到developer.metax-tech.com/doc中搜索开发文档中是否有相应的builtin函数，https://developer.metax-tech.com/api/client/document/preview/977/split_files/c_%E8%AF%AD%E8%A8%80%E6%89%A9%E5%B1%95.html#8btcc8cj98yn1