考虑以下情况:
要求:
程序序列(伪代码):
流程A(生产者):
int bufferPos = 0;
while( true )
{
if( isBufferEmpty( bufferPos ) )
{
writeData( bufferPos );
setBufferFull( bufferPos );
bufferPos = ( bufferPos + 1 ) % M;
}
}
流程B(消费者):
int bufferPos = 0;
while( true )
{
if( isBufferFull( bufferPos ) )
{
readData( bufferPos );
setBufferEmpty( bufferPos );
bufferPos = ( bufferPos + 1 ) % M;
}
}
现在这个古老的问题:如何有效地同步它们??
理想情况下,我想要内存屏障的内容,这可以保证所有以前的读/写都可以在所有CPU中看到,如下所示:
writeData( i );
MemoryBarrier();
//All data written and visible, set flag
setBufferFull( i );
这样,我只需要监视缓冲区标志,然后就可以安全地读取大数据块。
一般来说,我正在寻找像Preshing这样描述的获取/释放围栏的东西:
http://preshing.com/20130922/acquire-and-release-fences/
(如果我理解正确的话,C ++ 11原子只适用于单个进程的线程,而不适用于多个进程。)
然而,GCC自己的内存障碍(__sync_synchronize与编译器屏障asm volatile(“”:::“内存”)相结合)似乎没有按预期工作,因为写入在屏障后变得可见,当我期望它们完成时。
任何帮助将不胜感激......
顺便说一句:在Windows下,这可以正常使用volatile变量(Microsoft特定的行为)......
答案 0 :(得分:25)
Boost Interprocess支持共享内存。
Boost Lockfree有一个单生产者单一消费者队列类型(spsc_queue
)。这基本上就是你所说的循环缓冲区。
这是一个使用此队列以无锁方式传递IPC消息(在本例中为string
类型)的演示。
首先,让我们定义我们的类型:
namespace bip = boost::interprocess;
namespace shm
{
template <typename T>
using alloc = bip::allocator<T, bip::managed_shared_memory::segment_manager>;
using char_alloc = alloc<char>;
using shared_string = bip::basic_string<char, std::char_traits<char>, char_alloc >;
using string_alloc = alloc<shared_string>;
using ring_buffer = boost::lockfree::spsc_queue<
shared_string,
boost::lockfree::capacity<200>
// alternatively, pass
// boost::lockfree::allocator<string_alloc>
>;
}
为简单起见,我选择演示运行时大小spsc_queue
实现,随机请求容量为200个元素。
shared_string
typedef定义了一个从共享内存段透明分配的字符串,因此它们也可以与其他进程“神奇地”共享。
这是最简单的,所以:
int main()
{
// create segment and corresponding allocator
bip::managed_shared_memory segment(bip::open_or_create, "MySharedMemory", 65536);
shm::string_alloc char_alloc(segment.get_segment_manager());
shm::ring_buffer *queue = segment.find_or_construct<shm::ring_buffer>("queue")();
这将打开共享内存区域,找到共享队列(如果存在)。 注意这应该在现实生活中同步。
现在进行实际演示:
while (true)
{
std::this_thread::sleep_for(std::chrono::milliseconds(10));
shm::shared_string v(char_alloc);
if (queue->pop(v))
std::cout << "Processed: '" << v << "'\n";
}
消费者只是无限地监视队列中的待处理作业,并且每个处理一个~10ms。
生产者方面非常相似:
int main()
{
bip::managed_shared_memory segment(bip::open_or_create, "MySharedMemory", 65536);
shm::char_alloc char_alloc(segment.get_segment_manager());
shm::ring_buffer *queue = segment.find_or_construct<shm::ring_buffer>("queue")();
再次,在初始化阶段添加适当的同步。此外,您可能会让生产者负责在适当的时候释放共享内存段。在这个演示中,我只是“让它挂起”。这很适合测试,见下文。
那么,制片人做了什么?
for (const char* s : { "hello world", "the answer is 42", "where is your towel" })
{
std::this_thread::sleep_for(std::chrono::milliseconds(250));
queue->push({s, char_alloc});
}
}
是的,生产者在~750ms内生成正好3条消息然后退出。
请注意,如果我们这样做(假设一个带有作业控制的POSIX shell):
./producer& ./producer& ./producer&
wait
./consumer&
将“立即”打印3x3消息,同时让消费者继续运行。做
./producer& ./producer& ./producer&
此后,将实时显示消息“涓涓细流”(以3~25毫秒的间隔突发),因为消费者仍然在后台运行
在此要点中查看完整代码在线:https://gist.github.com/sehe/9376856