Apache Pig - 加载猪关系时缺少数字数据

时间:2017-02-27 17:59:48

标签: apache-pig

我正在学习Apache Pig。我正在尝试将一些数据加载到猪身上。当我在vi编辑器中看到txt文件时,我发现以下(样本)行。

  

[ABBOTT,DEEDEE W GRADES 9-12老师52,122.10 0 LBOE   亚特兰大独立学校系统2010]。

我使用以下命令将数据加载到pig关系中。

A = LOAD 'salaryTravelReport_sample.txt' USING PigStorage() as (name:chararray,
prof:chararray,max_sal:float,travel:float,board:chararray,state:chararray,year:int);

但是,当我在分布式环境中对猪进行转储时,我会发现以下结果(对于上面提到的行):

  

(ABBOTT,DEEDEE W,9-12-12岁的教师,0.0,LBOE,ATLANTA INDEPENDENT   学校系统,2010)。

数字数据"52,122.10 "似乎缺失了。

请帮忙。

1 个答案:

答案 0 :(得分:0)

PigStorage()是pig中的内置函数,它将记录分隔符作为参数。这里有它的标签 - > \ t

A = LOAD 'salaryTravelReport_sample.txt' USING PigStorage('\t') as (name:chararray,
prof:chararray,max_sal:float,travel:float,board:chararray,state:chararray,year:int);