gcc程序集中的atomic_inc和atomic_xchg

时间:2013-01-13 07:50:45

标签: gcc assembly x86 x86-64

我编写了以下用户级代码片段来测试两个子函数:atomic incxchg(参考Linux代码)。 我需要的只是尝试对32位整数执行操作,这就是我明确使用int32_t的原因。 我假设global_counter将由不同的主题竞争,而tmp_counter则可以。

#include <stdio.h>
#include <stdint.h>
int32_t global_counter = 10;

/* Increment the value pointed by ptr */
void atomic_inc(int32_t *ptr)
{
    __asm__("incl %0;\n"
        : "+m"(*ptr));
}

/* 
 * Atomically exchange the val with *ptr.
 * Return the value previously stored in *ptr before the exchange
 */
int32_t atomic_xchg(uint32_t *ptr, uint32_t val)
{
    uint32_t tmp = val;
    __asm__(
        "xchgl %0, %1;\n"
        : "=r"(tmp), "+m"(*ptr)
        : "0"(tmp)
        :"memory");
    return tmp;
}

int main()
{
    int32_t tmp_counter = 0;

    printf("Init global=%d, tmp=%d\n", global_counter, tmp_counter);

    atomic_inc(&tmp_counter);
    atomic_inc(&global_counter);
    printf("After inc, global=%d, tmp=%d\n", global_counter, tmp_counter);

    tmp_counter = atomic_xchg(&global_counter, tmp_counter);
    printf("After xchg, global=%d, tmp=%d\n", global_counter, tmp_counter);

    return 0;
}

我的两个问题是:

  1. 这两个子功能是否写得正确?
  2. 当我在32位或32位上编译时,它的行为是否相同 64位平台?例如,指针地址可能有不同 长度。或者inclxchgl会与操作数冲突吗?

1 个答案:

答案 0 :(得分:2)

我对这个问题的理解如下,如果我错了,请纠正我。

所有读取 - 修改 - 写入指令(例如:incl,add,xchg)都需要锁定前缀。锁定指令是通过在存储器总线上置位LOCK#信号来锁定其他CPU访问的存储器。

Linux内核中的__xchg函数意味着没有“锁定”前缀,因为xchg总是意味着锁定。 http://lxr.linux.no/linux+v2.6.38/arch/x86/include/asm/cmpxchg_64.h#L15

但是,atomic_inc中使用的incl没有这个假设,因此需要lock_prefix。 http://lxr.linux.no/linux+v2.6.38/arch/x86/include/asm/atomic.h#L105

不过,我认为您需要将* ptr复制到volatile变量以避免gcc优化。

威廉