如何扩展线程的栈空间

[复制链接]
103 3

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
在实验中需要每个线程有 5KB 以上的 private memory,看起来默认是 4KB;想要修改但无法找到 runtime 给出的 metax.ko module。求助

已在 /opt/maca; /lib/modules 中寻找无果。

[08:59:01.006][MCR][E]mc_runtime_api.cpp       :299 : 677318: [7f3ff42aa340] mcLaunchKernel: Returned mcErrorMemoryValueTooLarge
[08:59:01.010][MCR][E]mc_platform.cpp          :93  : Error in allocating private memory because the private memory size required in the kernel is greater than the maximum value set by the system, You can change insmod metax.ko by specifying parameters: pri_mem_sz=XXX.The system is set to :4 KB/Thread,kernel request:5 KB/thread

精彩评论3

22421274  注册会员  发表于 2024-11-3 22:18:55 | 显示全部楼层
同问,难道要减少每个thread处理的数字数量吗
dezheng.yan  版主  发表于 2024-11-5 14:05:14 | 显示全部楼层
《曦云系列_通用计算GPU_运行时API编程指南》的表4-1环境变量有修改pri_mem_size方法,不过这是个内核态环境变量,给你们的是Docker环境,没法去修改这个环节变量。继续往前走,尝试使用shared memory,减少甚至消除private memory的使用吧。private memory的性能等同于global memory,使用private memory必然导致kernel的性能会很差。
 楼主| gua  新手上路  发表于 2024-11-11 10:31:59 | 显示全部楼层
dezheng.yan 发表于 2024-11-5 14:05
《曦云系列_通用计算GPU_运行时API编程指南》的表4-1环境变量有修改pri_mem_size方法,不过这是个内核态环 ...

好的,谢谢。我再去了解一下!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表