我有一个M * N整数矩阵,我需要遍历并计算每个元素M [i] [j]:
The integer which appears most often in the submatrix from (i-k,j-k) to (i+k, j+k).
因此结果是一个矩阵,每个单元格是原始矩阵中[i,j]周围的主导数。
矩阵可能非常大,我需要在紧密循环中执行此操作,因此我希望通过并行计算最小化操作时间。
我知道GPU擅长矩阵乘法,但看起来这不能简化为简单的矩阵乘法。 (或者可以吗?)
是否可以在GPU上并行计算每个单元格?如果是,我想在iOS中实现这个,我应该使用什么编程接口,Metal? OpenGL的?
答案 0 :(得分:3)
是的,您可以在GPU上进行此计算。
金属似乎适用于图形和通用计算。所以你应该能够根据自己的需要使用它(这是一篇介绍它的文章:http://memkite.com/blog/2014/12/15/data-parallel-programming-with-metal-and-swift-for-iphoneipad-gpu/)
Accelerate 也可以满足我们的需求。
希望得到这个帮助。