我在java中编写一个基本的hadoop字数统计函数,需要将输出格式化为(k:v)而不是默认值(k'\ t'v)。到目前为止,我只找到了使用KeyValueTextInputFormat(不推荐使用)格式化输入分隔符的方法,并且似乎没有相应的输出格式版本。有一种简单的方法可以做到这一点吗?
答案 0 :(得分:0)
可以通过将作业mapred.textoutputformat.separator
中的此参数configuration
设置为所需的分隔符来实现。在您的情况下,它将类似于conf.set("mapred.textoutputformat.separator", ":");
。根据hadoop的版本和分布,参数名称可能不同。