Pig存储具有自定义行/记录分隔符的文件

时间:2016-08-04 20:16:11

标签: hadoop mapreduce apache-pig

我有一个带有ctrlB作为记录分隔符的文件。我能够通过在pig存储中重写LoaderInputFormat类和getInputFormat()方法来读取pig中的文件。但我无法使用ctrlB存储文件作为记录分隔符。

1 个答案:

答案 0 :(得分:1)

阅读 ctrl + b 分隔记录

SET textinputformat.record.delimiter '\n'
x= LOAD 'xyz' USING PigStorage('\u0002');

ctrl + b 分隔记录 -

store x into 'y' using PigStorage('\u0002');