MBP上的OpenCL代码运行速度比NVIDIA GTX 480上快。 我遇到了一个奇怪的问题。到目前为止,我正在OpenCL中实现一些线性代数,仅实现矩阵乘法,并且已经在笔记本电脑上进行了测试。代码非常简单: __kernel void matrix_mult(__global float* a, __global float* b, __global float* c, const int N)

已邀请:

要回复问题请先登录注册