我可以将特定数据预取到CUDA内核中的特定缓存级别吗?

据我所知,Fermi GPU支持预取L1或L2缓存。但是,在CUDA参考手册中我找不到任何关于它的东西。 Dues CUDA允许我的内核代码预取特定数据到特定级别的缓存?     
已邀请:
那么不是在指令级别,而是在这里有关GPU中预取的详细信息: GPGPU应用程序的多线程感知预取机制 (2010年微观架构ACM研讨会上的论文) 您可以在nVIDIA的PTX ISA参考文档中找到指令参考;相关说明为
prefetch
prefetchu
。     

要回复问题请先登录注册