如何在ARM处理器中使用NEON和double值计算dotproduct

时间:2013-05-16 08:19:37

标签: arm neon beagleboard

我需要做很多矢量计算。因此,我觉得应该使用NEON是明智的。问题是该功能取决于双打。这给了我两个选项,重写整个代码以便它可以使用浮点数,或者使用双精度作为输入创建一个函数,并兼作输出并使用浮点数进行计算。

我需要做以下计算:

dotproduct = A[0]*B[0] + A[1]*B[1] + A[2]*B[2]

数组的大小为双精度。如何使用NEON内在函数进行此计算?

1 个答案:

答案 0 :(得分:4)

NEON不支持双精度操作。您必须重写函数以对单精度值进行操作,或者使用标量双精度VFP指令而不是NEON。