针对OpenCL的优化sgemm

时间:2019-10-09 11:11:55

标签: c++ opencl matrix-multiplication gpgpu

我正在尝试为GPU实现基于OpenCL的sgemm。我正在关注 this链接。但是给定的教程假定数组采用列主形式,而我具有行主形式的数组。我坚持使用以下内核,无法确定我在做什么错。需要一点帮助。这里WIDTH = 4。

INI

0 个答案:

没有答案