Swift SIMD或加速总和UInt32

时间:2016-12-21 07:50:38

标签: swift simd accelerate-framework

是否存在加速或其他地方的内置工具,用于使用加速矢量运算对UInt32数组进行求和?

1 个答案:

答案 0 :(得分:4)

我想你想要加速诸如

之类的功能
func scalarsum (_ test_array: [UInt32]) -> UInt32 {
   var result : UInt32 = 0
   for x in test_array {
     result = result &+ x
   }
   return result
}

所以也许你可以写一些像这样复杂的东西......

func simdsum (_ test_array: [UInt32]) -> UInt32 {
   var tmpvector=uint4(0)
   // assume test_array.count is divisible by four
   let limit = test_array.count/4
   for i in 0..<limit {
     let thisvector = uint4(test_array[4*i],test_array[4*i+1],test_array[4*i+2],test_array[4*i+3])
     tmpvector = tmpvector &+ thisvector
   }
   return tmpvector[0] + tmpvector[1] + tmpvector[2] + tmpvector[3]
}

但是,让我们看一下swift为第一个函数生成的内容......

simdsum[0x100001070] <+448>: movdqu 0x20(%rcx,%rdi,4), %xmm2 simdsum[0x100001076] <+454>: movdqu 0x30(%rcx,%rdi,4), %xmm3 (...) simdsum[0x10000107c] <+460>: paddd %xmm2, %xmm0 simdsum[0x100001080] <+464>: paddd %xmm3, %xmm1

啊!啊!斯威夫特很聪明,可以对总和进行矢量化。

所以简短的回答是,如果您尝试使用Swift中的SIMD指令手动设计求和函数,您可能会浪费时间......编译器将自动为您完成工作。

请参阅https://github.com/lemire/Code-used-on-Daniel-Lemire-s-blog/tree/master/extra/swift/simdsum

的更多代码