将猪输出存储到csv文件中

时间:2013-10-28 05:50:51

标签: apache-pig

我有一个csv文件,我用它作为Pig Script的输入。 CSV具有类似

的数据
  

1045 966 320189       1048 555 714067       1035 199 975050       1026 748 814808       1018 656 103141       1004 186 686093       1016 292 553100       1043 864 750624       1050 839 785765       1002 454 452221       1041 807 330616       1019 538 680915       1002 950 583977       1036 638 111509       1031 687 876615

我的剧本---

REGISTER /home/user/myudfs.jar;
A = LOAS 'new.csv' using PigStorage(',');
STORE A INTO '/home/user/result.csv'
USING CSVExcelStorage(',', 'NO_MULTILINE', 'WINDOWS');

我有一个内置类CSVExcelStorage的myudfs jar。我正在我的剧本中注册。

执行脚本时,我收到错误

"ERROR 1070: Could not resolve myudfs.CSVExcelStorage using imports: [,org.apache.pig.builtin., org.apache.pig.impl.builtin.]"

请帮忙。

1 个答案:

答案 0 :(得分:0)

如果您在包下创建了UDF类,那么在PIG脚本中,您应该提供UDF类的完全限定名称,即

STORE A INTO '/home/user/result.csv'
USING HereGoesThePackageName.CSVExcelStorage(',', 'NO_MULTILINE', 'WINDOWS');