更改MapReduce(K,V)输出格式

时间:2014-03-17 23:46:14

标签: java hadoop io formatting output

我在java中编写一个基本的hadoop字数统计函数,需要将输出格式化为(k:v)而不是默认值(k'\ t'v)。到目前为止,我只找到了使用KeyValueTextInputFormat(不推荐使用)格式化输入分隔符的方法,并且似乎没有相应的输出格式版本。有一种简单的方法可以做到这一点吗?

1 个答案:

答案 0 :(得分:0)

可以通过将作业mapred.textoutputformat.separator中的此参数configuration设置为所需的分隔符来实现。在您的情况下,它将类似于conf.set("mapred.textoutputformat.separator", ":");。根据hadoop的版本和分布,参数名称可能不同。