算子平台

[复制链接]
110 15
LeaWron  中级会员  发表于 2024-11-29 14:33:16 | 显示全部楼层
kouryoubon 发表于 2024-11-29 14:24
但如果接口不能动,评测也直接调用接口,不就不能自定义BlockSize和GridSize了吗? ...

只是声明部分不能动,body随便改
 楼主| kouryoubon  注册会员  发表于 2024-11-29 14:40:42 | 显示全部楼层
本帖最后由 kouryoubon 于 2024-11-29 14:43 编辑
LeaWron 发表于 2024-11-29 14:33
只是声明部分不能动,body随便改

针对lab3,这里的接口指的是kernel函数还是main.cpp里调用的函数(这个函数里面调用kernel)?如果是后者那我之前没改这个接口而只是在这个host函数里调用另一个kernel并launch了不同的block和grid,结果运行时间就到了4s多;如果是前者那么评测系统直接调用kernel函数不也相当于固定了launch的block和grid。
然后我两点交的代码现在还在排队,这系统是真的
LeaWron  中级会员  发表于 2024-11-29 14:45:53 | 显示全部楼层
kouryoubon 发表于 2024-11-29 14:40
针对lab3,这里的接口指的是kernel函数还是main.cpp里调用的函数(这个函数里面调用kernel)?如果是后者 ...

两个都是,host的call_kernel和global的kernel都是,具体到 lab3 就是
  1. void macaTranspose(const float *d_input, float *d_output, int n) {
  2. //body
  3. gpuTransposeKernel<<<your_grid, your_block, your_sharedsize>>>(input, output, n);
  4. // ...
  5. }

  6. __global__ void gpuTransposeKernel(const float *input, float *output, int n) {
  7. //body
  8. }
复制代码

大概是这么个结构
LeaWron  中级会员  发表于 2024-11-29 14:48:49 | 显示全部楼层
kouryoubon 发表于 2024-11-29 14:40
针对lab3,这里的接口指的是kernel函数还是main.cpp里调用的函数(这个函数里面调用kernel)?如果是后者 ...

你没看公告吗,12月3号之后才能提交,10号截止,这段时间他们要清理之前的成绩
 楼主| kouryoubon  注册会员  发表于 2024-11-29 14:57:08 | 显示全部楼层
LeaWron 发表于 2024-11-29 14:48
你没看公告吗,12月3号之后才能提交,10号截止,这段时间他们要清理之前的成绩 ...

ok,谢谢🙏。
我知道怎么做了,虽然还是搞不懂这评测系统的逻辑。
看了公告,但寻思清理需要那么久吗。这系统真不行
LeaWron  中级会员  发表于 2024-11-29 14:59:29 | 显示全部楼层
kouryoubon 发表于 2024-11-29 14:57
ok,谢谢🙏。
我知道怎么做了,虽然还是搞不懂这评测系统的逻辑。
看了公告,但寻思清理需要那么久吗。这 ...

或许还有其他什么更新(bug)吧😂
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表