使用elephantbird加载json - 错误与简单的任务

时间:2016-08-08 18:38:03

标签: apache-pig elephantbird bigdata

我只是简单地加载数据来测试和分析。 我正在使用

  

https://www.reddit.com/r/datasets/comments/3oiv9z/reddit_september_comment_archive_is_now_available/

使用此文件中只获得10000行后,我尝试将它们加载到猪身上。

即使像这样简单的东西也会返回错误。

REGISTER '/user/cloudera/json-simple-1.1.1.jar'
REGISTER '/user/cloudera/elephant-bird-pig-4.1.jar'
REGISTER '/user/cloudera/elephant-bird-hadoop-compat-4.1.jar'

a = LOAD '/user/cloudera/top' USING com.twitter.elephantbird.pig.load.JsonLoader() as (json:map[]);

错误代码:

  

主类[org.apache.oozie.action.hadoop.PigMain],退出代码[2]

1 个答案:

答案 0 :(得分:0)

尝试运行此

REGISTER 'elephant-bird-pig-4.1.jar';
REGISTER 'elephant-bird-hadoop-compat-4.1.jar';

input = LOAD '/input/file' USING com.twitter.elephantbird.pig.load.JsonLoader('-nestedLoad') AS input_map;