银行冲突与CUDA中合并访问之间的关系
|
我尝试将一些数据从共享内存传输到全局内存。一些连续的线程将访问一个存储体(但不是相同的32位)。因此,存在一些银行冲突。 (我使用Visual Profiler进行检查)
但是,这些数据也将合并,然后传输到全局内存。 (我使用Visual Profiler进行检查)
为什么将数据以合并的方式写入全局内存?在我看来,流式多处理器会根据银行的带宽,一个接一个地弹出32位字。因此,无法在全局内存中合并内存事务。
我可能在这里犯一些错误。请帮助找出错误或给我一个合理的解释。谢谢。
没有找到相关结果
已邀请:
1 个回复
厢界山攀