我们可以在pig中通过:: delimiter拆分文件列

时间:2016-07-13 11:58:04

标签: hadoop apache-pig

我正在尝试读取一个分隔符为双冒号(::)的文件。我使用的是CSVExcelStorage,但它的错误是:

  

无法使用参数'[::]'

实例化'org.apache.pig.piggybank.storage.CSVExcelStorage'

那么有没有办法使用自定义分隔符来读取文件?

2 个答案:

答案 0 :(得分:1)

您可以将PigStorage与自定义分隔符一起使用。

答案 1 :(得分:1)

你可能错过了引号。

REGISTER /usr/lib/pig/piggybank.jar;
A = LOAD 'Test.csv' USING org.apache.pig.piggybank.storage.CSVExcelStorage('::')