标签: performance optimization mobile simd intrinsics
在PowerPC(PS3)上,向量寄存器和浮点寄存器之间的传输也通过内存,这可能导致昂贵的高速缓存未命中,因此需要尽量减少不必要的转换。
这适用于其他现代建筑吗?我对移动设备特别好奇,我的理解是内存延迟是限制因素。
注意:这是针对使用SSE内在函数(以及最终其他内容)的低级3D数学库,我正在尝试优化内存延迟。