使用do_futex搞砸了?

时间:2010-08-31 17:16:39

标签: linux synchronization volatile futex

我遇到了一个奇怪的错误。我实现了这两个功能:

int flag_and_sleep(volatile unsigned int *flag)
{
    int res = 0;

    (*flag) = 1;

    res = syscall(__NR_futex, flag, FUTEX_WAIT, 1, NULL, NULL, 0);
    if(0 == res && (0 != (*flag)))
        die("0 == res && (0 != (*flag))");
    return 0;
}

int wake_up_if_any(volatile unsigned int *flag)
{
    if(1 == (*flag))
    {
        (*flag) = 0;
        return syscall(__NR_futex, flag, FUTEX_WAKE, 1, NULL, NULL, 0);
    }
    return 0;
}

并通过运行两个Posix线程来测试它们:

static void die(const char *msg)
{
    fprintf(stderr, "%s %u %lu %lu\n", msg, thread1_waits, thread1_count, thread2_count);
    _exit( 1 );
}

volatile unsigned int thread1_waits = 0;

void* threadf1(void *p)
{
    int res = 0;
    while( 1 )
    {
        res = flag_and_sleep( &thread1_waits );
        thread1_count++;
    }
    return NULL;
}

void* threadf2(void *p)
{
    int res = 0;
    while( 1 )
    {
        res = wake_up_if_any( &thread1_waits );
        thread2_count++;
    }

    return NULL;
}

在thread2进行了大约一百万次迭代后,我得到了断言:

  

./ a.out的   0 == res&& (0!=(* flag))1 261129 1094433

这意味着系统调用 - 从而do_futex() - 返回0. Man说它应该只在do_futex(WAKE)调用唤醒时才会这样做。但是在我进行WAKE调用之前,我将标志设置为0.这里看起来标志仍为1.

这是英特尔,这意味着强大的内存模型。因此,如果在thread1中我看到来自thread2中的系统调用的结果,我还必须在调用之前看到线程2中写入的结果。

标志和指向它的所有指针都是易失性的,所以我看不到gcc如何无法读取正确的值。

我很困惑。

谢谢!

1 个答案:

答案 0 :(得分:2)

当线程1进入完整周期并且线程2从

进入时重新进入WAIT调用时,会发生竞争
(*flag) = 0;

return syscall(__NR_futex, flag, FUTEX_WAKE, 1, NULL, NULL, 0);

所以测试有问题。