Question

使用atomic_store存储的数据和使用atomic_load加载的数据是否总是一致？

具体来说：C11程序访问故意放置在现代Intel CPU上高速缓存行之间边界的64位数据。它使用atomic_store＆amp; atomic_load（来自<stdatomic.h>）从多个线程（在不同的核心上运行）访问此数据。

数据是否始终显示一致，或者加载它（atomic_load）有时会有一些属于旧值的字节，还有属于更新值的其他字节？

以下是基本的结构和变量定义以及程序的有趣部分，它们在一个循环中，并行地从多个线程发生：

struct Data {
    uint8_t bytes[CACHELINE__BYTECOUNT - 4];
    atomic_uint_fast64_t u64;
} __attribute__((packed)) __attribute__((aligned ((CACHELINE__BYTECOUNT))));

#define VAL1 (0x1111111111111111)
#define VAL2 (0xFFFFFFFFFFFFFFFF)

static struct Data data = { .u64 = VAL1 };

...

    for (uint32_t j = 0; j < 1000; j++) {
        atomic_store(&data.u64, VAL1);
        atomic_store(&data.u64, VAL2);
    }
    const uint64_t val = atomic_load(&data.u64);
    /* is 'val' always VAL1 or VAL2? */

（完整的可运行程序：https://gist.github.com/sinelaw/1230d4675d6a4fff394110f17e463954）

使用gcc 6.3.0和clang 3.7进行检查表明它不是原子的：

$ clang -std=c11 -Wall -Wextra /tmp/atomic.c -o /tmp/atomic -lpthread
$ /tmp/atomic
ERROR: oh no, got: 11111111FFFFFFFF

所以要么是程序中存在错误，要么我误解了<stdatomic.h>，或者编译器中存在错误。

Answer 1

正确编写的程序无法获取未正确对齐的对象。正确对齐的int64无法跨越缓存行。

所以你的问题的答案是：你的程序中有一个错误。您通过使用非标准构造（__attribute__）故意引入的错误来破坏事物。

对于编译器来说，确保stdatomic适用于未对齐的值是很疯狂的，因为这需要一个全局锁，这就是stdatomic特别要避免的。

来自<stdatomic.h>的atomic_store / load是否适用于英特尔上未对齐的跨缓存行数据？

1 个答案: