性能 - 多线程或多进程应用程序

时间:2013-05-16 06:16:43

标签: linux multithreading multiprocessing

为了在Linux上开发高度网络密集型服务器应用程序,首选哪种架构?这个想法是这个应用程序通常在具有多个核心(虚拟或物理)的机器上运行。考虑到性能是关键标准,选择多线程应用程序还是采用多进程设计的应用程序更好?我知道共享资源和同步以从多个进程访问这些资源是很多编程开销,但如前所述,整体性能是关键要求,因此我们可以忽略这些事情。编程语言是C / C ++。

我听说即使是多线程应用程序(单个进程)也可以利用多个内核并独立地在不同的内核上运行每个线程(只要没有同步问题)。这个调度由内核完成。如果是这样,多线程应用程序和多进程应用程序之间的性能差异不大吗? Nginx使用多进程架构并且速度非常快,但是可以通过多线程应用程序获得相同的性能吗?

感谢。

2 个答案:

答案 0 :(得分:3)

linux上的进程和线程彼此非常相似 - 主要区别在于整个虚拟内存是共享的,而且某些事情如信号处理也不同。

这样可以在线程之间进行更便宜的上下文切换(不需要昂贵的MMU重新加载等),但不一定会导致速度差异很大(特别是在线程创建之外)。

对于设计高度网络密集型应用程序,基本上唯一解决方案是使用一个公平的架构(否则你将陷入系统的大量进程/线程,并花更多的时间在他们的管理而不是实际运行的工作代码),你对套接字上的I / O作出反应,并根据哪些套接字展示活动进行适当的操作。

关于在这种情况下遇到的问题的着名文章是“C10k问题”,可从http://www.kegel.com/c10k.html获得 - 它描述了不同的I / O方法,所以尽管有点过时,这是一个非常好的介绍。

在深入探讨类似反应堆的设计之前要小心 - 它们会变得笨拙和复杂,所以看看你是否能够使用提供更好抽象的库/语言(Erlang是我个人最喜欢的,像Go这样的协同语言也很有用。

答案 1 :(得分:1)

如果您的线程在独立的情况下独立完成工作,那么在Linux下,根本没有理由不使用多个进程。多个进程会增加内存使用量,因为每个进程都有自己的私有内存空间,但另一方面,在独立线程之间共享内存空间是更糟糕的决定。线程与进程之间的上下文切换通常对于进程而不是线程更好,尽管它有点体系结构和代码依赖。使用锁和互斥锁进行序列化是安全的。流程在Linux中更易于管理和交互。这是一份你可能感兴趣的好文件(http://elinux.org/images/1/1c/Ben-Yossef-GoodBadUgly.pdf)。