矩阵乘法优化:循环平铺

时间:2014-05-06 01:29:54

标签: c caching optimization matrix matrix-multiplication

我试图通过平铺循环来优化2个1024x1024矩阵的乘法。我发现使用128和64的块大小给了我最好的结果,但我只通过猜测和检查获得了这些数字。当试图对2000x2000矩阵使用相同的块大小时,结果远非理想。在尝试优化矩阵乘法时,有人能指出我能够在逻辑上解决哪种瓦片尺寸最佳吗?

0 个答案:

没有答案