如何在PIG中设置自定义分隔符

时间:2016-12-29 20:58:40

标签: mapreduce apache-pig cloudera hue

在Pig中设置自定义TextInputFormat分隔符的正确语法是什么?我已尝试过以下几种变体,但将其视为字符串值而不是回车符。

set textinputformat.record.delimiter '\r\n';

猪版本为0.12.0-cdh5.9.0,Hadoop版本为2.6.0-cdh5.9.0

2 个答案:

答案 0 :(得分:1)

不理想但是解决方法:

创建一个属于myprops.properties的属性文件,其中包含以下行:textinputformat.record.delimiter=\r\n

然后运行您的脚本:pig -P ~/myprops.properties -f path/to/pigscript.pig

看来这是第四条评论第四段中提到的已知问题:PIG_4572

答案 1 :(得分:0)

这是语法

SET textinputformat.record.delimiter '<delimiter>';

这对我有用