两个都是,host的call_kernel和global的kernel都是,具体到 lab3 就是
- void macaTranspose(const float *d_input, float *d_output, int n) {
- //body
- gpuTransposeKernel<<<your_grid, your_block, your_sharedsize>>>(input, output, n);
- // ...
- }
- __global__ void gpuTransposeKernel(const float *input, float *output, int n) {
- //body
- }
复制代码
大概是这么个结构 |