应用错误收集

Hadoop的TaskTracker是否为每个任务生成一个新的JVM？

时间：2013-11-20 16:41:37

标签： java hadoop mapreduce

根据TaskTracker Hadoop Wiki page，TaskTracker会生成一个新的JVM来完成它正在跟踪的实际工作。但是，页面中存在拼写错误，并且不清楚TaskTracker是否为正在跟踪的所有任务生成一个JVM，或者TaskTracker是否为每个任务生成一个JVM 它正在跟踪。我问的原因是因为我很好奇如果使用静态变量来保存作业级变量可以简单地在map函数中实例化变量。

1 个答案:

答案 0 :(得分：2)

它为每个任务生成一个JVM。

您可以通过设置此配置参数mapred.job.reuse.jvm.num.tasks来重用jvms，但这只是为了减少JVM的旋转时间。从功能上讲，它仍然会重建类，这对你来说无关紧要。

如果变量相对较小，如字符串或其他东西，你不应该太担心。如果它更大，你可以开始担心！例如，从分布式缓存加载大型文件到每个任务一次Map可能是昂贵的。您可以通过减少映射任务为每项任务执行更多工作来缓解此问题。我甚至做过像Redis或ZooKeeper中存储共享变量这样的疯狂事情。

相关问题

NSOperation不会产生新的线程？

performSelectorInBackground是否为每个调用生成新线程？

NSOperation会产生一个新线程吗？

Hadoop的TaskTracker是否为每个任务生成一个新的JVM？

H2是否为每个远程连接产生一个新线程？那么，有限制吗？

CWnd :: Create会产生一个新线程吗？

TaskTracker为每个输入拆分或每个键值对产生一个新的Mapper？

打开一个新的终端会产生一个新的shell吗？

PHP - 为beanstalkd中的每个新作业生成工作者

C＃产生新任务

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？