标签: c++ multithreading thread-local
我在Xeon上做了一些关于thread_local add op的性能测试,发现在多线程环境中,thread_local写入比非thread_local(只是普通变量,而不是原子)快1.5倍。我无法弄清楚原因。