当我使用64kb以上的常量缓存时,为什么我的内核不会失败? (OpenCL / CUDA)
我在我的内核上运行了一些使用常量缓存的测试。如果我使用16,000个浮点数(16,000 * 4KB = 64KB),那么一切都运行顺利。如果我使用16,200它仍然可以顺利运行。如果我使用16,400个浮点数,我的结果会出错(而不是来自OpenCL)。难道只是在技术上有64.x KB的常量缓存可用吗?如果我正在使用16,000个花车,我是否应该相信我的代码?通常我希望代码在你使用东西达到规定的限制时中断。
没有找到相关结果
已邀请:
2 个回复
浮凰量
疾桓