标签: c++ arm neon
我在c ++类中有一个循环,它执行cholesky factorisation,其中A,B,C,D和E是整数数组。
int i = 10; for (int j = A [i] + 1 ; j < C [i] ; j++) { E[D [j]] -= B[j] * val ; }
在每次迭代中,数组的一个元素被更新并累积到不同的E索引。如何使用ARM Neon内在函数有效地向量化该循环以进行优化?