线程级并行度VS进程级并行度

时间:2019-01-17 08:06:51

标签: linux multithreading parallel-processing

我对线程和进程有基本的了解,我想知道为什么每本教科书都谈到线程级并行性,进程级并行性是否存在?线程级并行性比进程级并行性有什么优势?

2 个答案:

答案 0 :(得分:2)

简短的回答:性能和编程容易

长答案:

首先,必须考虑两种不同的并行性:基于任务的并行性(或“宏并行性”)(例如,任务A修改一些数据并将结果传递给任务B)和数据级并行性(或“微并行性”)(例如,处理大型矩阵或向量的负载分散在多个并行代理之间。

第二,考虑并行性时,不同的代理程序需要交换信息。对于线程级并行性,所有线程都可以访问相同的地址空间,而通信仅是内存访问。 相反,进程级并行性要求进行过程间通信(IPC)的特定方法,以允许进程交换数据。存在几种IPC方法(管道,共享内存,套接字等)(例如,参见https://en.wikipedia.org/wiki/Inter-process_communication)。

问题在于这些方法通常具有重要的开销,并且通信可能需要几个耗时的数据副本。这就是为什么它们现在很少在单个proc上使用的主要原因。但是,当考虑在不同且可能距离较远的处理器上运行的进程时,将大量使用进程级并行性。例如,客户端-服务器应用程序是进程级并行性。

在单个处理器上,进程级并行性目前还用于shell脚本,作为重用现有程序的简单方法。 例如,在Unix上,类似“ sort

此外,线程级并行性的主要优点是:

1)通过共享内存的简单快速的通信机制

2)非常适合任务级并行性或数据级并行性

3)易于编程

第2点和第3点可能是最重要的。尽管线程级并行性可以基于独立的任务,但是速度通常受到限制,并且大多数当前的应用程序都依赖于数据级并行性,线程可以很好地适应于此。公用内存空间使通信开销非常有限(考虑锁定时除外),并且存在非常高效且易于使用的并行化工具(例如open-MP)

在独立进程上实现这种并行性也是可能的。当考虑使用大型计算器进行高性能计算时,它甚至经常发生。存在一些(粗略的)工具(例如“消息传递接口”),但是实现远比线程级并行性复杂得多,容易出错并且效率较低。

答案 1 :(得分:0)

存在进程级并行性。

但是,Linux内核对线程或进程一无所知。它只知道任务。

Task_parallelism由进程或线程执行。

线程是与父任务共享大多数资源(地址空间,mmap,管道,打开的文件处理程序,套接字等)的任务。并行性不可避免的问题是共享资源。

还有一些Linux API可控制线程之间共享或不共享多少资源,从而提供更大的灵活性。

这就是为什么线程级并行性更受欢迎的原因,尤其是在为诸如数据库之类的商用服务器编写的应用程序中。