有article声称Metal可能比使用大型数组计算的Accelerate框架更快。
在查看Metal的着色器语言文档后,我意识到不支持双精度浮点数或64位整数数组。我忽略了什么吗?我以为Metal是为64位A7处理器而设计的?
答案 0 :(得分:3)
A7上的CPU支持64位整数和双精度浮点数。 GPU没有。金属着色器在GPU上运行,而不是CPU。
顺便说一句,该博客文章中的基准测试非常值得怀疑。它以极其低效的方式使用Accelerate。虽然编写良好的Metal当然有可能比正确使用Accelerate接口更快,但这并不是基准测试真正显示的内容。