Hadoop任务进度

时间:2013-03-30 15:14:38

标签: hadoop

我需要计算在Hadoop集群中的所有节点上运行的每个map任务的进度。我想将处理数据的大小除以整个输入数据的大小,但我不知道如何获取任务的这些信息。

我看到TaskStatus类有一个方法getProgress(),但没有对它的描述。它能提供我需要的价值吗?

1 个答案:

答案 0 :(得分:2)

对于地图任务,yes getProgress()返回映射器在输入文件中的进度。对于减少任务,计算不那么简单。 This article有一个很好的解释。