Hadoop,如何在OutputFormat

时间:2015-12-04 12:12:28

标签: java hadoop hadoop2

我有一个仅限地图的作业和自定义的OutputFormat,它扩展了FileOutputFormat,并希望将具有相同名称(或略微修改)的输出文件写为输入。所以我需要在我的自定义RecordWriter中获取文件名。我知道这可以通过以下代码在Mapper中实现:

FileSplit fileSplit = (FileSplit)context.getInputSplit();
String filename = fileSplit.getPath().getName();

但不知道如何将文件名从mapper传递到我的RecordWriter。

1 个答案:

答案 0 :(得分:0)

您需要按照here

所述使用MultipleOutputFormat

您需要使用上下文/配置对象将所需的字符串文件名从mapper传递给reducer。