请求算法指点

[复制链接]
91 8

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x


我的本意不是想在这里作弊,但是我的运行时间一直降不下来,我想在这里求一些指点,希望有哪位大佬可以教教我。
上面的是我的lab1实验的核函数,图3是我的mcTracer的json报告。
1.png
2.png
3.png

Tracer_out.zip

2.86 KB, 下载次数: 2

精彩评论8

LeaWron  中级会员  发表于 2024-11-30 12:27:34 | 显示全部楼层
有改过main.cpp吗,为什么这里还要自己分配device上的空间
 楼主| KHOOYONGJIE  注册会员  发表于 2024-11-30 21:30:03 | 显示全部楼层
本帖最后由 KHOOYONGJIE 于 2024-11-30 21:36 编辑
LeaWron 发表于 2024-11-30 12:27
有改过main.cpp吗,为什么这里还要自己分配device上的空间

哦哦哦 我还以为只能在kernel.cpp上更改,目前只是改动kernel.cpp而已
LeaWron  中级会员  发表于 2024-11-30 21:57:12 | 显示全部楼层
KHOOYONGJIE 发表于 2024-11-30 21:30
哦哦哦 我还以为只能在kernel.cpp上更改,目前只是改动kernel.cpp而已

main不能改,我的意思是你main没改过为啥这里要自己再分配一次空间
 楼主| KHOOYONGJIE  注册会员  发表于 2024-11-30 23:44:23 | 显示全部楼层
本帖最后由 KHOOYONGJIE 于 2024-11-30 23:47 编辑
LeaWron 发表于 2024-11-30 21:57
main不能改,我的意思是你main没改过为啥这里要自己再分配一次空间

我忽略了main那边已经分配了空间,删掉分配空间的部分后,速度快了一倍,感谢大佬。


除了这个以外,请问大佬还有什么东西是可以改良的吗?

LeaWron  中级会员  发表于 2024-12-1 01:10:46 | 显示全部楼层
KHOOYONGJIE 发表于 2024-11-30 23:44
我忽略了main那边已经分配了空间,删掉分配空间的部分后,速度快了一倍,感谢大佬。

课上有讲,共享内存那些,或者网上搜也有很多资料;在这里问首先交流延迟太高,而且我也未必讲的明白🙃
 楼主| KHOOYONGJIE  注册会员  发表于 2024-12-1 13:14:24 | 显示全部楼层
本帖最后由 KHOOYONGJIE 于 2024-12-1 13:16 编辑
LeaWron 发表于 2024-12-1 01:10
课上有讲,共享内存那些,或者网上搜也有很多资料;在这里问首先交流延迟太高,而且我也未必讲的明白🙃 ...

明白的,谢谢大佬,你这样说我大概有一点方向了
inkstone  注册会员  发表于 2024-12-6 17:49:50 | 显示全部楼层
LeaWron 发表于 2024-12-1 01:10
课上有讲,共享内存那些,或者网上搜也有很多资料;在这里问首先交流延迟太高,而且我也未必讲的明白🙃 ...

谢谢LeaWron的回答和解答,我这边经常忙于各种事情,这边回复有些滞后
inkstone  注册会员  发表于 2024-12-6 17:51:28 | 显示全部楼层
KHOOYONGJIE 发表于 2024-12-1 13:14
明白的,谢谢大佬,你这样说我大概有一点方向了

共享内存这部分内容,今天中午在“学在浙大”增加了相关内容的课前预习,也可以去学习了解一下,有问题下周二课上可以继续讨论
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表