应用错误收集

多核架构的多线程

时间：2010-06-28 13:09:22

标签： c++ windows multithreading multicore

当你遇到线程A读取一些全局变量并且线程B写入同一个变量的情况时，现在除非读/写在单个核心上不是原子的，否则你可以在没有同步的情况下进行，但是在运行时会发生什么一台多核机器？

7 个答案:

答案 0 :(得分：9)

即使在单核上，也不能假设操作是原子的。这可能是你在汇编程序中进行编码的情况，但是，如果按照你的问题用C ++进行编码，你就不会知道它将编译成什么。

您应该依赖于您编码的抽象级别的同步原语。在你的情况下，这是线程调用C ++。无论是pthread，Windows线程还是其他东西。

这与我在whether i++ was thread-safe的另一个答案中提出的理由相同。最重要的是，您不知道，因为您没有编码到那个级别（如果您正在使用内联汇编程序和/或您理解并且可以控制在幕后发生的事情，那么您将不再编码C ++级别，你可以忽略我的建议。）

操作系统和/或操作系统类型的库对它们运行的环境有很多了解，远远超过C ++编译器。使用适当的同步原语将为您节省大量的烦恼。

答案 1 :(得分：7)

它将具有与单核相同的陷阱，但由于必须在核之间进行L1缓存同步而具有额外的延迟。

注意 - “你可以在不同步的情况下完成”并不总是真实的陈述。

答案 2 :(得分：5)

即使在单一机器上，如果没有明确的同步，也绝对无法保证这一点。

有几个原因：

操作系统可能会在任何时间（任意两条指令之间）中断线程，然后运行另一个线程，
如果没有明确的同步，编译器可能会非常自由地重新排序指令，违反您认为的任何保证，并且
即使CPU也可以这样做，即时重新排序说明。

如果要在两个线程之间进行正确的通信，则需要某种同步。始终，否例外。

该同步可以是OS或线程API提供的互斥锁，也可以是CPU特定的原子指令，或者只是普通的内存屏障。

答案 3 :(得分：1)

对于多核计算机上的非原子操作，您需要使用系统提供的Mutex来同步访问。

对于C ++，boost mutex库提供了几种互斥类型，为OS提供的互斥锁类型提供了一致的接口。

如果您选择将boost视为同步/多线程库，则应阅读Synchronization概念。

答案 4 :(得分：0)

根据您的具体情况，以下内容可能相关。虽然它不会使你的程序运行不正确，但它可以在速度上产生很大的不同。即使您没有访问相同的内存位置，如果两个内核在缓存中的同一页面上颠簸（尽管因为您仔细同步数据结构而不是相同的位置），您可能会因缓存效应而受到性能影响。

这里有一个很好的“虚假分享”概述： http://www.drdobbs.com/go-parallel/article/showArticle.jhtml;jsessionid=LIHTU4QIPKADTQE1GHRSKH4ATMY32JVN?articleID=217500206

答案 5 :(得分：0)

就（新）C ++标准而言，如果程序包含数据争用，则程序的行为是未定义的。如果存在线程交错，则程序具有数据竞争，使得它包含来自不同线程的两个相邻冲突存储器访问（这是一种非常正式的方式，如果两个冲突的访问可以同时发生，则程序具有数据竞争“ ）。

请注意，运行的核心数无关紧要，程序的行为是未定义的（特别是优化程序可以根据需要对指令进行重新排序）。

答案 6 :(得分：0)

没有人提到隐式同步的优点和缺点。

主要的“专业人士”当然是程序员可以写任何东西而不必费心同步。

主要的“骗局”是需要很多时间。隐式同步需要通过高速缓存，至少（您可能认为）两个核心共有的第一个高速缓存。错误！计算机中可能安装了多个物理处理器，因此同步不能在高速缓存中停止，它需要一直向下到RAM。如果要在那里进行同步，还需要与需要与任何总线主控设备的内存同步的其他设备进行同步。总线主控设备可能是经典PCI总线上的卡，并且可能以33 MHz运行，因此隐式同步也需要等待它们以确认可以写入或读取特定的RAM位置。我们说的是核心和最慢总线之间的时钟速度差异只有100倍，而最慢的总线需要几个自己的总线周期才能以可靠的方式做出反应。因为同步必须是可靠的，否则没有用。

因此，在为隐式同步实现电子设备（最好让程序员无论如何都要明确处理）和更快的系统之间进行选择时，可以在必要时进行同步，答案是显而易见的。

同步的显式键是LOCK前缀和XCHG mem，reg指令。

你可以说隐式同步就像训练轮子一样：你不会倒在地上，但你不能特别快速地转身或转得特别快。很快你就会厌倦，并希望继续前进。当然，你会受伤，但在这个过程中你要么学习要么退出。