这条指令是a的开头 未与16字节对齐的循环 地址边界。为了最佳 性能,你应该对齐 使用编译器启动热循环 指示。使用gcc 3.3或更高版本,请使用 -falign-loops = 16编译器标志。
for (int i=0; i < 4; i++) { // line with the info
//...code
}
我如何设置该标志,是否真的能提高性能?
答案 0 :(得分:3)
鲨鱼的提示并不总是合适的。在大多数情况下,对齐循环并没有太大的区别。关注代码中的瓶颈,看看在算法/代码级别可以做些什么,然后再进行非常小的调整。