对于无锁堆栈,确保使用双比较和交换指令?

时间:2014-05-31 15:33:25

标签: c++ multithreading assembly x86 lock-free

(假设64位x86-64架构和Intel第3代/第4代CPU)

以下是来自“动作中的并发”一书的堆栈的无锁实现,第202页:

template<typename T>
class lock_free_stack
{
private:
    struct node;

    struct counted_node_ptr
    {
        int external_count;
        node* ptr;
    };

    struct node
    {
        std::shared_ptr<T> data;
        std::atomic<int> internal_count;
        counted_node_ptr next;

        node(T const& data_):data(std::make_shared<T>(data_)),internal_count(0){}
    };

    std::atomic<counted_node_ptr> head;

public:
    ~lock_free_stack()
    {
        while(pop());
    }

    void push(T const& data)
    {
        counted_node_ptr new_node;
        new_node.ptr=new node(data);
        new_node.external_count=1;
        new_node.ptr->next=head.load();
        while(!head.compare_exchange_weak(new_node.ptr->next,new_node));
    }
};

它在代码下面说:

  

在那些支持双字比较和交换的平台上   操作,这种结构将足够小   std :: atomic是无锁的。

我相信x86-64确实支持双CAS(我不记得我头顶的指令名称)。

如果我要检查程序集(并且我看不到双CAS指令)我需要编写什么内联汇编函数来确保使用双CAS?

更新 - 我想我已经找到了我在这里寻找的东西:

http://blog.lse.epita.fr/articles/42-implementing-generic-double-word-compare-and-swap-.html

template<typename T>
struct DPointer <T,sizeof (uint64_t)> {
public:
  union {
    uint64_t ui[2];
    struct {
      T* ptr;
      size_t count;
    } __attribute__ (( __aligned__( 16 ) ));
  };

  DPointer() : ptr(NULL), count(0) {}
  DPointer(T* p) : ptr(p), count(0) {}
  DPointer(T* p, size_t c) : ptr(p), count(c) {}

  bool cas(DPointer<T,8> const& nval, DPointer<T,8> const& cmp)
  {
    bool result;
    __asm__ __volatile__ (
        "lock cmpxchg16b %1\n\t"
        "setz %0\n"
        : "=q" ( result )
         ,"+m" ( ui )
        : "a" ( cmp.ptr ), "d" ( cmp.count )
         ,"b" ( nval.ptr ), "c" ( nval.count )
        : "cc"
    );
    return result;
  }

  // We need == to work properly
  bool operator==(DPointer<T,8> const&x)
  {
    return x.ptr == ptr && x.count == count;
  }
};

2 个答案:

答案 0 :(得分:2)

最旧版本的x86_64不支持此指令(CMPXCHG16B),这是Windows 8.1 / 64位及更高版本所必需的。 Afaik这是Athlon64系列的大部分(插座751,939和一些X2,也许是Pentium D的第一代(8xx))

如何强制编译器使用某个指令各不相同,通常必须使用一个不完全可移植的内在函数。

答案 1 :(得分:0)

你可以断言

std::atomic<T>::is_lock_free()