我有一个带有ctrlB作为记录分隔符的文件。我能够通过在pig存储中重写LoaderInputFormat类和getInputFormat()方法来读取pig中的文件。但我无法使用ctrlB存储文件作为记录分隔符。
答案 0 :(得分:1)
阅读 ctrl + b 分隔记录
SET textinputformat.record.delimiter '\n'
x= LOAD 'xyz' USING PigStorage('\u0002');
写 ctrl + b 分隔记录 -
store x into 'y' using PigStorage('\u0002');