时间:2010-07-24 18:15:12

标签: python streaming hadoop hadoop-streaming

2 个答案:

答案 0 :(得分:1)

在连接JSON文件时,您可以在每个字典中用spaec替换所有换行符。除了作为空格字符外,Newline在JSON中没有任何特殊含义。

答案 1 :(得分:0)

concatenated-json-mapreduce是一种自定义输入格式,记录读取器将根据打开/关闭括号中的push / pop拆分JSON对象。

它被编写来处理流JSON(而不是用换行符分隔的JSON),只要它使用\n而不是实际的新行来构成JSON对象即可。