我编写了以下用户级代码片段来测试两个子函数:atomic inc
和xchg
(参考Linux代码)。
我需要的只是尝试对32位整数执行操作,这就是我明确使用int32_t
的原因。
我假设global_counter
将由不同的主题竞争,而tmp_counter
则可以。
#include <stdio.h>
#include <stdint.h>
int32_t global_counter = 10;
/* Increment the value pointed by ptr */
void atomic_inc(int32_t *ptr)
{
__asm__("incl %0;\n"
: "+m"(*ptr));
}
/*
* Atomically exchange the val with *ptr.
* Return the value previously stored in *ptr before the exchange
*/
int32_t atomic_xchg(uint32_t *ptr, uint32_t val)
{
uint32_t tmp = val;
__asm__(
"xchgl %0, %1;\n"
: "=r"(tmp), "+m"(*ptr)
: "0"(tmp)
:"memory");
return tmp;
}
int main()
{
int32_t tmp_counter = 0;
printf("Init global=%d, tmp=%d\n", global_counter, tmp_counter);
atomic_inc(&tmp_counter);
atomic_inc(&global_counter);
printf("After inc, global=%d, tmp=%d\n", global_counter, tmp_counter);
tmp_counter = atomic_xchg(&global_counter, tmp_counter);
printf("After xchg, global=%d, tmp=%d\n", global_counter, tmp_counter);
return 0;
}
我的两个问题是:
incl
和xchgl
会与操作数冲突吗?答案 0 :(得分:2)
我对这个问题的理解如下,如果我错了,请纠正我。
所有读取 - 修改 - 写入指令(例如:incl,add,xchg)都需要锁定前缀。锁定指令是通过在存储器总线上置位LOCK#信号来锁定其他CPU访问的存储器。
Linux内核中的__xchg函数意味着没有“锁定”前缀,因为xchg总是意味着锁定。 http://lxr.linux.no/linux+v2.6.38/arch/x86/include/asm/cmpxchg_64.h#L15
但是,atomic_inc中使用的incl没有这个假设,因此需要lock_prefix。 http://lxr.linux.no/linux+v2.6.38/arch/x86/include/asm/atomic.h#L105
不过,我认为您需要将* ptr复制到volatile变量以避免gcc优化。威廉