标签: c++ opencl matrix-multiplication gpgpu
我正在尝试为GPU实现基于OpenCL的sgemm。我正在关注 this链接。但是给定的教程假定数组采用列主形式,而我具有行主形式的数组。我坚持使用以下内核,无法确定我在做什么错。需要一点帮助。这里WIDTH = 4。
INI