PyCUDA内存寻址:内存偏移量?
|
我在设备上有大量生成的数据(A [i,j,k]),但我只需要A [i,:::]的一个\'slice \',在常规CUDA中,可以通过一些指针算法轻松完成。
pycuda可以做同样的事情吗?即
cuda.memcpy_dtoh(h_iA,d_A+(i*stride))
显然,这是完全错误的,因为没有尺寸信息(除非从目标形状推断出),但希望您能明白这一点?
没有找到相关结果
已邀请:
2 个回复
委婪绷冗诉
搜洼挂时