谢谢,再请教一下,有办法限制kernel的寄存器使用量吗,我发现一段代码,分成2段,单独测试寄存器每一段寄存器使用量都很少,但是我把它们合并到一起,寄存器使用量就增加了非常多,我试了用__launch_bounds__(256, 4)这样的方式加以限制,但是编译的时候显示: warning: set minimum blocks' number is illegal in Maca and the value will be ignored [-Wmaca-min-blocks-per-multiprocessor]