算子平台

[复制链接]
115 15

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
1.lab3评判有多个案例,那么最终成绩取哪个案例得到的运行时间?2.每个题目只有前十个人看得到运行时间,其他人怎么看自己的运行时间?
3. 英雄榜是只能显示28个人吗,其他人怎么看自己的总排名?
4. 算子平台的运行时间和堡垒机上的运行时间差几倍是为什么


精彩评论15

LeaWron  中级会员  发表于 2024-11-29 11:02:01 | 显示全部楼层
1. 我估计是按最短的那个时间来,你看他的运行日志是不行的,运行日志只是通过程序打印的信息,只能做参考
2. 运行时间不是在提交信息里看吗,不然怎么获得调试信息
3. 我估计只有28个人做了,不然1分都能上榜
4. 堡垒机用的设备和提交后运行的设备不一样,AP堡垒机更多一些,但是影响不会很大,几倍差距的话可能是你的优化有点太针对堡垒机环境了
 楼主| kouryoubon  注册会员  发表于 2024-11-29 12:20:06 | 显示全部楼层
LeaWron 发表于 2024-11-29 11:02
1. 我估计是按最短的那个时间来,你看他的运行日志是不行的,运行日志只是通过程序打印的信息,只能做参考
...

感谢回复。
2. 提交信息的耗时也太夸张了,4s了都,完全看不出来题目是按什么计时。和榜上的一对比也很离谱,零点几us,我运行日志要跑0.4ms,看json纯看kernel好像又只有16us
3. 我就是提交通过了,没上题目榜,也没上最终榜
现在题目又都撤了,可能在修复吧
LeaWron  中级会员  发表于 2024-11-29 13:20:22 | 显示全部楼层
kouryoubon 发表于 2024-11-29 12:20
感谢回复。
2. 提交信息的耗时也太夸张了,4s了都,完全看不出来题目是按什么计时。和榜上的一对比也很离 ...

你是不是改他的接口了,如果他检查不到接口似乎是按总运行时长来的
然后提交时长是在

提交信息

提交信息
这里看
LeaWron  中级会员  发表于 2024-11-29 13:24:07 | 显示全部楼层
kouryoubon 发表于 2024-11-29 12:20
感谢回复。
2. 提交信息的耗时也太夸张了,4s了都,完全看不出来题目是按什么计时。和榜上的一对比也很离 ...

然后之前是只有4、5、6三个题有正确检测的,所以其他的只要交了能跑有相应文件就可以通过,时间都可以很夸张,所以我都没管那些题了。
后来第一题也检测了,我比较好奇0.01ms是怎么做到的,1<<24个数据的读写感觉都不止这么点时间。
至于零点几μs,这个是因为他只改了单位,没改时间,相当于是之前的人用着ms的单位,实际上是零点几ms
你这个kernel16μs也挺夸张的
 楼主| kouryoubon  注册会员  发表于 2024-11-29 13:55:17 | 显示全部楼层
LeaWron 发表于 2024-11-29 13:24
然后之前是只有4、5、6三个题有正确检测的,所以其他的只要交了能跑有相应文件就可以通过,时间都可以很 ...

我main文件啥也没改,就改了kernel.cpp里面的 Screenshot 2024-11-29 at 13.48.12.png 然后第一题的0.01ms之前我弄出来过,就是因为他只检测最终答案,所以直接return一个数就好了。
然后kernel16us我是看tracer的json文件的,可能有其他损耗没算进去,实际看日志大约是512大小的矩阵的花费在0.37~0.44ms(堡垒机倒是0.1ms级别)这个区间的(我也好奇这么大的区间是不是得刷好几次才能刷出来最短时间)

LeaWron  中级会员  发表于 2024-11-29 13:59:32 | 显示全部楼层
kouryoubon 发表于 2024-11-29 13:55
我main文件啥也没改,就改了kernel.cpp里面的然后第一题的0.01ms之前我弄出来过,就是因为他只检测最终答 ...

我的意思是你的接口得和他一模一样才行,我之前因为FETCH_FLOAT4不能从const float数组取,把const float *改成了float*,一样有这样的问题,接口的名字和参数是什么都不能改
LeaWron  中级会员  发表于 2024-11-29 14:02:10 | 显示全部楼层
kouryoubon 发表于 2024-11-29 13:55
我main文件啥也没改,就改了kernel.cpp里面的然后第一题的0.01ms之前我弄出来过,就是因为他只检测最终答 ...

还有有的题或者有的算法确实可以刷出更好更接近上限的成绩,有的就不行,相对稳定
 楼主| kouryoubon  注册会员  发表于 2024-11-29 14:08:19 | 显示全部楼层
LeaWron 发表于 2024-11-29 13:59
我的意思是你的接口得和他一模一样才行,我之前因为FETCH_FLOAT4不能从const float数组取,把const float ...

意思就是自定义的内核函数名和参数要完全匹配他最初的形式?这太蠢了,和提交文件夹必须名为“program”一样。我懂了,十分感谢
 楼主| kouryoubon  注册会员  发表于 2024-11-29 14:24:07 | 显示全部楼层
LeaWron 发表于 2024-11-29 13:59
我的意思是你的接口得和他一模一样才行,我之前因为FETCH_FLOAT4不能从const float数组取,把const float ...

但如果接口不能动,评测也直接调用接口,不就不能自定义BlockSize和GridSize了吗?
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表