为什么POSIX互斥量被认为比futex更重或更慢? pthread互斥锁类型的开销来自哪里?我听说pthread互斥体基于互斥体,当无争议时,不要对内核进行任何调用。那时似乎pthread互斥体只是一个围绕futex的“包装”。
开销是否只是在函数包装调用中,并且需要互斥函数来“设置”futex(即,基本上是pthread互斥函数调用的堆栈设置)?或者使用pthread互斥锁进行一些额外的内存屏障步骤?
答案 0 :(得分:29)
创建Futex以提高pthread互斥锁的性能。 NPTL使用futexes,LinuxThreads早于futexes,我认为这是“慢”考虑的地方。 NPTL互斥体可能会有一些额外的开销,但它不应该太多。
修改强> 实际开销基本上包括:
因此,几个周期(典型情况)到几个周期+分支错误预测+额外的缓存未命中(非常糟糕的情况)。
答案 1 :(得分:14)
对您的问题的简短回答是,已知futexes尽可能高效地实现,而pthread互斥量可能是也可能不是。至少,pthread互斥锁具有与确定互斥锁类型相关的开销,而互斥锁则没有。因此,futex几乎总是至少与pthread互斥锁一样有效,除非有人认为某些结构比futex更轻,然后发布一个pthreads实现,将其用于默认的互斥锁。
答案 2 :(得分:8)
因为它们尽可能地留在用户空间中,这意味着它们需要更少的系统调用,这本身就更快,因为用户和内核模式之间的上下文切换很昂贵。
当你谈到POSIX线程时,我假设你正在谈论内核线程。完全可能有一个POSIX线程的完全用户空间实现,它不需要系统调用,但有其他问题。
我的理解是,futex位于内核POSIX线程和用户空间POSIX线程之间。
答案 3 :(得分:8)
从技术上讲,pthread互斥量并不比futex更慢或更快。 pthread只是一个标准API,因此它们是慢还是快取决于该API的实现。
特别是在Linux中,pthread互斥体实现为futexes,因此很快。实际上,您不想使用futex API本身,因为它很难使用,在glibc中没有适当的包装函数,并且需要在汇编中进行编码,这是不可移植的。幸运的是,glibc维护者已经在pthread互斥API的引擎下为我们编写了所有这些内容。
现在,因为大多数操作系统没有实现futexes ,所以程序员通常用pthread mutex来表示你从pthread互斥体的常规实现中获得的性能,这是较慢的。
因此,统计事实是,在大多数符合POSIX标准的操作系统中,pthread互斥锁在内核空间中实现,并且比futex慢。在Linux中,它们具有相同的性能。可能有其他操作系统在用户空间中实现了pthread互斥(在非竞争情况下),因此具有更好的性能,但我现在只知道Linux。
答案 4 :(得分:1)
在AMD64上,futex是4个字节,而NPTL pthread_mutex_t是56个字节!是的,有很大的开销。