我一直在玩IOS中的图像处理。由于我想用除了像openCV这样的库以外的我自己的代码来做所有事情,我正在探索各种方法来加速我的程序。我确实有大量的浮点计算,所以我真的很想使用DSP。
然而,当我使用CPU(用c ++编写)和vDSP在模拟器上进行大型矩阵乘法比较我的直接代码的结果时,我惊讶地发现vDSP消耗的时间明显更多。矩阵大约是1百万x 6和6 x 2,然后CPU和vDSP分别大约需要120毫秒和180毫秒。
我知道我应该在真实设备上测试所有内容,而且我肯定会这样做。但我希望更多地了解其原因和含义。 IOS模拟器如何模拟DSP? GPU(openGL)怎么样?
非常感谢,分叉!
答案 0 :(得分:0)
没有。 CPU设备设置,短矢量加速(适用于vDSP)和GPU架构在iOS设备和x86 Mac上的模拟器之间有很大差异。不同的iOS设备型号之间的性能差异也很大(10倍或更多)。在一些微基准测试中,某些iOS设备比某些Mac上的模拟器更快;有些人要慢得多。