标签: hadoop
我是Hadoop的新手,想知道如何写入公共输出文件来存储有关最近执行的作业的元数据。
目前我正在处理文件a,b,c和d;我有一个自定义计数器,它添加了有关prcoessed文件数量的信息,但我想知道所有已处理的文件名。
有关最佳方法的评论吗? 分布式缓存能帮忙吗?
答案 0 :(得分:0)
Context.setStatus
会有帮助吗?
像这样使用:
Context.setStatus("Processed "+file);