标签: multithreading parallel-processing openmp
通常,Open MP屏障的时钟周期开销是多少?
我的意思是
假设所有线程已经同时完成手头的工作。它们都同时到达障碍的起点。 通过障碍需要几个额外的时钟周期?
在Linux上同步现有线程是否涉及对OS内核的调用?
谢谢。
相关:
How is thread synchronization implemented, at the assembly language level?
https://spcl.inf.ethz.ch/Publications/.pdf/atomic-bench.pdf