我正在学习Apache Pig。我正在尝试将一些数据加载到猪身上。当我在vi编辑器中看到txt文件时,我发现以下(样本)行。
[ABBOTT,DEEDEE W GRADES 9-12老师52,122.10 0 LBOE 亚特兰大独立学校系统2010]。
我使用以下命令将数据加载到pig关系中。
A = LOAD 'salaryTravelReport_sample.txt' USING PigStorage() as (name:chararray,
prof:chararray,max_sal:float,travel:float,board:chararray,state:chararray,year:int);
但是,当我在分布式环境中对猪进行转储时,我会发现以下结果(对于上面提到的行):
(ABBOTT,DEEDEE W,9-12-12岁的教师,0.0,LBOE,ATLANTA INDEPENDENT 学校系统,2010)。
数字数据"52,122.10 "
似乎缺失了。
请帮忙。
答案 0 :(得分:0)
PigStorage()是pig中的内置函数,它将记录分隔符作为参数。这里有它的标签 - > \ t
A = LOAD 'salaryTravelReport_sample.txt' USING PigStorage('\t') as (name:chararray,
prof:chararray,max_sal:float,travel:float,board:chararray,state:chararray,year:int);