标签: ios performance matrix-multiplication accelerate-framework
我第一次使用Accelerate框架进行巨大的矩阵乘法,但在这种情况下我不理解vDSP和CBLAS之间的区别。它们的性能有何不同?
答案 0 :(得分:3)
也就是说,检查性能的方式是测试,而不是假设某些事情可以实现。在某些情况下,手写for循环比等效的Accelerate函数快得多,因为编译器可以比函数更好地优化循环。同样,只有测试可以告诉你。有时加速可以代表显着的改进。 (有关更多信息,请参阅http://robnapier.net/fast-bezier-intro)。
for