针对HIVE的自定义记录分隔符

时间:2015-05-08 17:38:22

标签: hadoop hive

对于Hive版本 - 0.14 我们可以提供自定义记录分隔符" \ r \ n \ n \ n"而不是默认值' [ "\r" , "\n", "\r\n" ]

因此,在我的情况下,由于默认行分隔符,2行在HIVE中变为4行,而我需要" \ r \ n \ r \ n"是行分隔符。

1 个答案:

答案 0 :(得分:0)

虽然有自定义字段分隔符org.apache.pig.piggybank.storage.MyRegExLoader,但是对于自定义记录分隔符,使用PIG将换行符转换为null并使用换行符作为记录分隔符