这就是我正在尝试的
grunt> myData = load '/user/sunil/pigDev/player.csv' using PigStorage(',') AS (
id:int,
name:chararray,
age:int,
gender:chararray,
game:chararray,
location:chararray);
grunt> describe myData;
data: {id: int,name: chararray,age: int,gender: chararray,game: chararray,location: chararray}
grunt> dump myData;
初始化并加载所有内容,同时创建jar(我在控制台日志中可以看到)。但是,最终会在控制台中使用以下日志消息永久挂起。
2015-06-10 18:32:30,163 [main] INFO org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher - 0% complete
我检查了所有日志文件(nodemanager
,proxyserver
和yarn-resourcemanager
),看不到任何错误消息。
我正在使用CDH版本:Hadoop 2.5.0-cdh5.3.0
猪版:Apache Pig version 0.12.0-cdh5.3.0 (rexported)