使用atomic_store存储的数据和使用atomic_load加载的数据是否总是一致?
具体来说:C11程序访问故意放置在现代Intel CPU上高速缓存行之间边界的64位数据。它使用atomic_store&amp; atomic_load(来自<stdatomic.h>
)从多个线程(在不同的核心上运行)访问此数据。
数据是否始终显示一致,或者加载它(atomic_load)有时会有一些属于旧值的字节,还有属于更新值的其他字节?
以下是基本的结构和变量定义以及程序的有趣部分,它们在一个循环中,并行地从多个线程发生:
struct Data {
uint8_t bytes[CACHELINE__BYTECOUNT - 4];
atomic_uint_fast64_t u64;
} __attribute__((packed)) __attribute__((aligned ((CACHELINE__BYTECOUNT))));
#define VAL1 (0x1111111111111111)
#define VAL2 (0xFFFFFFFFFFFFFFFF)
static struct Data data = { .u64 = VAL1 };
...
for (uint32_t j = 0; j < 1000; j++) {
atomic_store(&data.u64, VAL1);
atomic_store(&data.u64, VAL2);
}
const uint64_t val = atomic_load(&data.u64);
/* is 'val' always VAL1 or VAL2? */
(完整的可运行程序:https://gist.github.com/sinelaw/1230d4675d6a4fff394110f17e463954)
使用gcc 6.3.0和clang 3.7进行检查表明它不是原子的:
$ clang -std=c11 -Wall -Wextra /tmp/atomic.c -o /tmp/atomic -lpthread
$ /tmp/atomic
ERROR: oh no, got: 11111111FFFFFFFF
所以要么是程序中存在错误,要么我误解了<stdatomic.h>
,或者编译器中存在错误。
答案 0 :(得分:9)
正确编写的程序无法获取未正确对齐的对象。正确对齐的int64无法跨越缓存行。
所以你的问题的答案是:你的程序中有一个错误。您通过使用非标准构造(__attribute__
)故意引入的错误来破坏事物。
对于编译器来说,确保stdatomic适用于未对齐的值是很疯狂的,因为这需要一个全局锁,这就是stdatomic特别要避免的。