从我的学习中我知道饥饿,死锁,公平和其他并发问题的概念。然而,理论在某种程度上与实践不同,真正的工程任务往往涉及比学术等等更多的细节......
作为一名C ++开发人员,我一直担心线程问题......
假设您有一个共享变量x
,它引用程序内存的一些较大部分。该变量在两个线程A
和B
之间共享。
现在,如果我们考虑来自x
和A
线程的B
上的读/写操作(可能同时),则需要同步这些操作,对吧?因此,x
的访问需要某种形式的同步,这可以通过使用互斥锁来实现。
现在让我们考虑另一个场景,x
最初由线程A
编写,然后传递给线程B
(不知何故),该线程只读取x
。然后,线程B
生成对x
y
的响应,并将其传递回线程A
(再次以某种方式)。我的问题是:我应该使用什么同步原语来使这个场景成为线程安全的。我读过关于原子,更重要的是内存栅栏 - 这些是我应该依赖的工具吗?
这不是存在“关键部分”的典型情况。相反,一些数据在线程之间传递,不可能在同一内存位置进行并发写入。因此,在编写之后,应首先以某种方式“刷新”数据,以便其他线程在读取之前可以看到它处于有效且一致的状态。如何在文献中称之为“可见度”?
pthread_once
及其Boost / std对应物call_once
怎么样?如果x
和y
在线程之间通过一种“消息队列”传递,它是通过“一次”功能访问的,这会有所帮助吗? AFAIK它作为一种记忆围栏,但我找不到任何确认。
CPU缓存及其一致性如何?从工程角度来看,我应该知道什么?这些知识是否有助于上述场景或C ++开发中常见的任何其他场景?
我知道我可能会混合很多主题,但我想更好地了解常见的工程实践是什么,以便我可以重复使用已知的模式。
这个问题主要与C ++ 03中的情况有关,因为这是我的日常工作环境。由于我的项目主要涉及Linux,所以我可能只使用pthreads和Boost,包括Boost.Atomic。但是,如果有关此类问题的任何内容随着C ++ 11的出现而发生变化,我也会感兴趣。
我知道问题是抽象的而不是那么精确,但任何输入都可能有用。
答案 0 :(得分:10)
你有一个共享变量x
那你出错的地方。如果使用某种线程安全的消费者 - 生产者队列移交工作项的所有权,并且从程序的其余部分(包括所有业务逻辑)的角度来看,没有任何共享,那么线程就会变得更容易。
消息传递还有助于防止缓存冲突(因为没有真正的共享 - 除了生产者 - 消费者队列本身,如果工作单元很大,这对性能有轻微影响 - 并将数据组织成消息帮助减少虚假分享。)
当您将问题分成子问题时,并行性最佳。小的子问题也更容易推理。
您似乎已经在考虑这些问题了,但是,对于使用消息传递的应用程序来说,原子,互斥和围栏等线程原语并不是很好。找到一个真正的队列实现(队列,循环,Disruptor,它们使用不同的名称,但都满足相同的需求)。原语将在队列实现中使用,但不会在应用程序代码中使用。