标签: python streaming hadoop hadoop-streaming
答案 0 :(得分:1)
在连接JSON文件时,您可以在每个字典中用spaec替换所有换行符。除了作为空格字符外,Newline在JSON中没有任何特殊含义。
答案 1 :(得分:0)
concatenated-json-mapreduce是一种自定义输入格式,记录读取器将根据打开/关闭括号中的push / pop拆分JSON对象。
它被编写来处理流JSON(而不是用换行符分隔的JSON),只要它使用\n而不是实际的新行来构成JSON对象即可。
\n