猪CSVExcelStorage删除标题

时间:2014-11-03 11:34:11

标签: apache-pig

我已经看到有一个构造函数接受头控制参数

CSVExcelStorage(String delimiter, String multilineTreatmentStr, String eolTreatmentStr, String headerTreatmentStr) 

但是我还没有找到“SKIP_INPUT_HEADER”常量的值是什么。

1 个答案:

答案 0 :(得分:2)

我不知道为什么你想要SKIP_INPUT_HEADER的常量值,但如果你打算在加载过程中删除标题,那么请检查下面的例子

input.csv
Name,Age,Location
a,10,chennai
b,20,banglore

PigScript:(With SKIP_INPUT_HEADER)
REGISTER '/tmp/piggybank.jar';
A  = LOAD 'input.csv' USING org.apache.pig.piggybank.storage.CSVExcelStorage(',', 'NO_MULTILINE', 'UNIX', 'SKIP_INPUT_HEADER');
DUMP A;

Output:
(a,10,chennai)
(b,20,banglore)



PigScript:(Without SKIP_INPUT_HEADER)
REGISTER '/tmp/piggybank.jar';
A  = LOAD 'input.csv' USING org.apache.pig.piggybank.storage.CSVExcelStorage(',', 'NO_MULTILINE', 'UNIX');
DUMP A;

OutPut:
(Name,Age,Location)
(a,10,chennai)
(b,20,banglore)