蜂巢表中json文件中换行符面临的问题

时间:2018-10-05 05:46:47

标签: hadoop hive newline

实际上,我正在尝试将json文件加载到hive表中。此json文件包含换行符,因为配置单元表中的一条记录存储为两行。

我在这里使用jsonserde将json文件插入到蜂巢表中。该Serde无法处理换行符问题。

我的创建语句:

CREATE EXTERNAL TABLE sample_table(
    gender STRING, name STRING
)
ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe'
LOCATION '/user/input/sample' ;

通过互联网进行研究,我找到了一种解决方案,即在hive-site.xml中将“ hive.query.result.fileformat”设置为SequenceFile。

我也使用Ambari使用SequenceFile设置了上述属性。但是,仍然面临着同样的问题。

我在hive-site.xml中发现了另一个属性,即“ hive.default.fileformat”,默认设置为“ TextFile”。我也需要更改此属性吗?

有人可以帮我解决同一件事吗

0 个答案:

没有答案