CUDA块如何分为经线?
|
如果我从一个带有块尺寸的网格开始我的内核:
dim3 block_dims(16,16);
现在如何将网格块拆分为扭曲?这样的块的前两行是形成一个翘曲,还是前两列,还是按任意顺序排列?
假设GPU计算能力为2.0。
没有找到相关结果
已邀请:
2 个回复
才改隘瘁
变化最快,然后ѭ2second变化第二快,而
变化最快。这在功能上与多维数组中的列主排序相同。从线程按此顺序顺序构造经线。因此,对于2d块的计算是
编程指南和PTX指南都对此进行了介绍。
部窖空
和WarpSize = 32)的回答: