PigStorage多字节字段分隔符

时间:2015-05-08 17:35:59

标签: hadoop apache-pig

需要一个StoreFunc实现,可以允许PIG将字段分隔符作为多个字节,例如 - ^^(\ u005E \ u005E)

尝试了所有这些但没有成功 -

store B into '/tmp/test/output'  using PigStorage('\u005E\u005E');
store B into '/tmp/test/output'  using PigStorage('^^');
store B into '/tmp/test/output'  using PigStorage('\\^\\^');

是否存在类似于StoreFunc的LoadFunc实现org.apache.pig.piggybank.storage.MyRegExLoader的现有实现,可以在写入时为字段分隔符采用正则表达式?

1 个答案:

答案 0 :(得分:0)

通过使用CONCAT作为第一个分隔符并使用PigStorage语法进行第二次出现来解决这个问题