javascript - 为什么网络工作者的表现在30秒后急剧下降？

为什么网络工作者的表现在30秒后急剧下降？

时间：2014-07-12 01:11:24

标签： javascript multithreading performance google-chrome web-worker

我正在尝试在Web worker中执行时提高脚本的性能。它旨在解析浏览器中的大型文本文件而不会崩溃。一切都运行良好，但我注意到使用Web worker时大文件的性能存在严重差异。

所以我进行了一个简单的实验。我在同一个输入上运行了两次脚本。第一次运行在页面的主线程中执行脚本（没有web worker）。当然，这会导致页面冻结并变得无法响应。对于第二次运行，我在Web worker中执行了脚本。

对于本实验中的小文件（＆lt; ~100 MB），性能差异可以忽略不计。但是，对于大型文件，解析在工作线程中需要大约20倍：

Performance of both scenarios on same graph

预计蓝线。它只需要大约11秒来解析文件，性能相当稳定：

Performance of script without web worker

红线是网络工作者内部的表现。这更令人惊讶：

Performance of script in web worker

前30秒的锯齿状线是正常的（jag是由解析文件的每个块后将结果发送到主线程的轻微延迟引起的）。但是，解析在30秒时相当突然减慢。（请注意，我只使用一个Web工作者来完成工作;一次只能使用一个工作线程。）

我已确认在使用postMessage()将结果发送到主线程时，延迟不。减速是在解析器的the tight loop中，这是完全同步的。由于我无法解释的原因，该循环显着减慢，并且在30秒后随着时间变慢。

但这只发生在网络工作者身上。正如您在上面看到的那样，在主线程中运行相同的代码，运行非常顺畅和快速。

为什么会这样？我该怎么做才能提高性能？（我不希望任何人完全理解该文件中的所有1,200多行代码。如果你这样做，那真是太棒了，但我觉得这与网络工作者的关系比我的代码更多，因为它在主文件中运行正常线程。）

系统：我在Mac OS 10.9.4上运行Chrome 35，内存为16 GB;四核2.7 GHz Intel Core i7，具有256 KB L2缓存（每个核心）和3 MB的L3缓存。文件块大小约为10 MB。

更新：刚刚在Firefox 30上尝试了它并且不在工作线程中遇到同样的减速（但在主线程中运行时它比Chrome慢））。然而，尝试使用更大的文件（大约1 GB）进行相同的实验，在大约35-40秒之后（看起来）显着减速。

2 个答案:

答案 0 :(得分：15)

Tyler Ault suggested one possibility on Google+结果非常有帮助。

他推测在工作线程中使用FileReaderSync（而不是普通的'async FileReader）并没有提供垃圾收集发生的机会。

将工作线程更改为异步使用FileReader（这看起来像是一个性能步骤向后）将该过程加速回到37秒，就在我预期的那样

我还没有收到Tyler的回复，而且我不完全确定我理解为什么垃圾收集会成为罪魁祸首，但是关于FileReaderSync的一些事情是彻底放慢了代码的速度

答案 1 :(得分：2)

你在运行什么硬件？您可能遇到CPU缓存抖动问题。例如，如果CPU高速缓存是每个核心1MB（仅作为示例）并且您开始尝试使用数据不断替换高速缓存（高速缓存未命中），那么您将遭受减速 - 这在MT系统中非常常见。这在IO传输中也很常见。此外，这些系统也倾向于为线程上下文提供一些OS开销。因此，如果产生大量线程，您可能花费更多时间来管理上下文而不是线程“正在工作”。我还没有查看你的代码，所以我可能会离开 - 但我的猜测是由于你的应用程序在做什么而在内存问题上。：）

喔。怎么修。尝试使用与硬件匹配的小块单块执行块。最大限度地减少一次使用的线程数量 - 尽量将它们保持在硬件中核心数量的2-3倍（这实际上取决于您拥有的核心数量）。希望有所帮助。