我使用c / c ++ opengl es3.0从weblas端口sgemm函数。 (我瞄准了esgemm)。 我有一个使用这个sgemm函数的应用程序。 但我发现Android上的速度非常慢。 这是我的测试结果。 PC(Core™i7-6700 CPU @ 3.40GHz×8 HD Graphics 530(Skylake GT2)):
openBlas 52.91ms
esgemm 67.7ms
CL blas 68.88
Android S6(Exynos 7420 2.1GHz x4 1.5GHz x4,Mali-T760):
在上面的分数中,CL blas是我的opencl版本sgemm(来自clMathLibraries的端口)。 性能与此opengl es版本相同。openBlas 62.96ms
esgemm 1027.59ms
Cl blas 1054.55ms
有没有人做类似的工作? 为什么S6的速度如此之慢? 移动GPU无法支持数据计算吗?
代码已上传github esgemm