简短版:
我正在尝试从here中的无锁单生产者单一消费者队列实现中使用的C ++ 11替换std :: atomic。如何将其替换为boost::atomic
?
长版:
我正试图通过工作线程从我们的应用程序中获得更好的性能。每个线程都有自己的任务队列。我们必须在出列/排队每个任务之前使用锁同步。
然后我找到了Herb Sutter关于无锁队列的文章。这似乎是一个理想的替代品。但是代码使用了C ++ 11中的std::atomic
,我目前无法将其引入项目中。
更多Google搜索引发了一些示例,例如this one for Linux (echelon's)和this one for Windows (TINESWARE's)。两者都使用平台的特定构造,如WinAPI的InterlockedExchangePointer
和GCC的__sync_lock_test_and_set
。
我只需要支持Windows& Linux也许我可以逃脱一些#ifdef
。但我认为使用boost::atomic
提供的内容可能会更好。 Boost Atomic尚未成为官方Boost库的一部分。所以我从http://www.chaoticmind.net/~hcb/projects/boost.atomic/下载了源代码,并在我的项目中使用了包含文件。
这是我到目前为止所得到的:
#pragma once
#include <boost/atomic.hpp>
template <typename T>
class LockFreeQueue
{
private:
struct Node
{
Node(T val) : value(val), next(NULL) { }
T value;
Node* next;
};
Node* first; // for producer only
boost::atomic<Node*> divider; // shared
boost::atomic<Node*> last; // shared
public:
LockFreeQueue()
{
first = new Node(T());
divider = first;
last= first;
}
~LockFreeQueue()
{
while(first != NULL) // release the list
{
Node* tmp = first;
first = tmp->next;
delete tmp;
}
}
void Produce(const T& t)
{
last.load()->next = new Node(t); // add the new item
last = last.load()->next;
while(first != divider) // trim unused nodes
{
Node* tmp = first;
first = first->next;
delete tmp;
}
}
bool Consume(T& result)
{
if(divider != last) // if queue is nonempty
{
result = divider.load()->next->value; // C: copy it back
divider = divider.load()->next;
return true; // and report success
}
return false; // else report empty
}
};
需要注意的一些修改:
boost::atomic<Node*> divider; // shared
boost::atomic<Node*> last; // shared
和
last.load()->next = new Node(t); // add the new item
last = last.load()->next;
和
result = divider.load()->next->value; // C: copy it back
divider = divider.load()->next;
我是否正确地在boost :: atomic中应用了load()(以及隐式store())?我们可以说这相当于Sutter原来的C ++ 11无锁队列吗?
PS。我在SO上研究了许多线程,但似乎没有一个提供boost :: atomic&amp; amp;无锁队列。
答案 0 :(得分:1)
您是否尝试过Intel Thread Building Blocks' atomic<T>
?跨平台和免费。
也...
单个生产者/单个消费者使您的问题变得更加容易,因为您的线性化点可以是单个运算符。如果您准备接受有界队列,它会变得更容易。
有界队列为缓存性能提供了优势,因为您可以保留缓存对齐的内存块以最大限度地提高命中率,例如:
#include <vector>
#include "tbb/atomic.h"
#include "tbb/cache_aligned_allocator.h"
template< typename T >
class SingleProdcuerSingleConsumerBoundedQueue {
typedef vector<T, cache_aligned_allocator<T> > queue_type;
public:
BoundedQueue(int capacity):
queue(queue_type()) {
head = 0;
tail = 0;
queue.reserve(capacity);
}
size_t capacity() {
return queue.capacity();
}
bool try_pop(T& result) {
if(tail - head == 0)
return false;
else {
result = queue[head % queue.capacity()];
head.fetch_and_increment(); //linearization point
return(true);
}
}
bool try_push(const T& source) {
if(tail - head == queue.capacity())
return(false);
else {
queue[tail % queue.capacity()] = source;
tail.fetch_and_increment(); //linearization point
return(true);
}
}
~BoundedQueue() {}
private:
queue_type queue;
atomic<int> head;
atomic<int> tail;
};
答案 1 :(得分:0)
从文档中查看此boost.atomic ringbuffer example:
#include <boost/atomic.hpp>
template <typename T, size_t Size>
class ringbuffer
{
public:
ringbuffer() : head_(0), tail_(0) {}
bool push(const T & value)
{
size_t head = head_.load(boost::memory_order_relaxed);
size_t next_head = next(head);
if (next_head == tail_.load(boost::memory_order_acquire))
return false;
ring_[head] = value;
head_.store(next_head, boost::memory_order_release);
return true;
}
bool pop(T & value)
{
size_t tail = tail_.load(boost::memory_order_relaxed);
if (tail == head_.load(boost::memory_order_acquire))
return false;
value = ring_[tail];
tail_.store(next(tail), boost::memory_order_release);
return true;
}
private:
size_t next(size_t current)
{
return (current + 1) % Size;
}
T ring_[Size];
boost::atomic<size_t> head_, tail_;
};
// How to use
int main()
{
ringbuffer<int, 32> r;
// try to insert an element
if (r.push(42)) { /* succeeded */ }
else { /* buffer full */ }
// try to retrieve an element
int value;
if (r.pop(value)) { /* succeeded */ }
else { /* buffer empty */ }
}
代码的唯一限制是必须在编译时知道缓冲区长度(或者在构造时,如果用std::vector<T>
替换数组)。据我所知,允许缓冲区增长和缩小并非易事。