无法使用load和dump命令读取Pig中的日期字段

时间:2014-07-28 20:40:58

标签: hadoop apache-pig

我有一些此类型的示例数据,我试图使用LOAD和DUMP命令在控制台上读取和显示。我手动在Ubuntu中创建了这个CSV文件。正如您在底部看到的那样,dump命令只显示逗号而不是'dob'字段。

emps.csv

1,John,35,M,101,50000.00,03/03/79
2,Jack,30,F,201,3540000.00,09/10/84

用于加载数据的命令

empdata = load 'emps.csv'  using PigStorage(',') as (id:int,name:chararray,age:int,gender:chararray,deptId:int,sal:double,dob:datetime);
dump empdata;

显示数据的命令

dump empdata;

输出

(1,John,35,M,101,50000.0,)
(2,Jack,30,F,102,60000.0,)

如上面的输出所示,'dob'字段值丢失,只显示逗号。请指导。

1 个答案:

答案 0 :(得分:0)

日期时间功能可用0.11

查看您正在使用的版本

empdata = load 'emps.csv'  using PigStorage(',') as (id:int,name:chararray,age:int,gender:chararray,deptId:int,sal:double,dob:chararray);

尝试使用dob作为chararray并执行以下步骤

B = foreach empdata generate ToDate(dob,'string format'),$0,$1,$2,$3,$4,$5;

dump B;