在文件中存储有关Hadoop作业的信息

时间:2012-08-13 21:47:38

标签: hadoop

我是Hadoop的新手,想知道如何写入公共输出文件来存储有关最近执行的作业的元数据。

目前我正在处理文件a,b,c和d;我有一个自定义计数器,它添加了有关prcoessed文件数量的信息,但我想知道所有已处理的文件名。

有关最佳方法的评论吗? 分布式缓存能帮忙吗?

1 个答案:

答案 0 :(得分:0)

Context.setStatus

会有帮助吗?

像这样使用:

Context.setStatus("Processed "+file);