标签: multithreading clang compiler-optimization hyperthreading
是否可以选择针对每个处理器核心特定数量的线程来调整Clang生成的代码?
例如,IBM POWER处理器每个处理器内核最多支持八个独立的执行线程。 IBM XL C / C ++编译器具有调整suboption,该调整旨在更好地调度生成的机器指令。例如,-mtune=power9:smt4用于调整代码以在SMT4模式下运行(每个内核四个线程)。
-mtune=power9:smt4