任何人都可以在hadoop中使用MapReduce来解决下面的问题。
假设我有一个具有以下结构的文件
我希望输出是键和值的串联字符串,如下所示 输出
答案 0 :(得分:1)
是的,您可以通过多种方式解决问题,具体取决于数据和文件的结构和大小,也许还有一些信息,我们可以为您提供更准确的答案:
您还可以检查类 KeyValueTextInputFormat ,它允许您使用与行偏移不同的键作为键逐行读取文件。您可以通过 mapreduce.input.keyvaluelinerecordreader.key.value.separator
指定分隔符(逗号)我希望它有所帮助