将JSON格式表加载到Pig中

时间:2014-03-04 12:01:04

标签: json hadoop apache-pig

我有一个用Hive创建的表。它需要JSON格式数据(我使用SERDE创建它)。

我想知道是否可以将此表中的数据加载到Pig然后进行一些转换。

这是我的JSON数据:

{"id":"1", "word":"2" ,"flag":1}.

你有任何线索吗?


我试过了

A = LOAD ‘data.json’
USING PigJsonLoader();

但没有成功。这是我得到的错误:

  

[main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1200:意外字符''

我转向

json_objects = LOAD 'hdfs://user/cloudera/test.json' 
               USING org.apache.pig.piggybank.storage.JsonLoader();

但它说:

  

无法使用解析org.apache.pig.piggybank.storage.JsonLoader   import:[,org.apache.pig.builtin。,org.apache.pig.impl.builtin。]。

1 个答案:

答案 0 :(得分:0)

您的错误原因是该类不存在。如果您在版本0.12.1中运行pig,您将在http://pig.apache.org/docs/r0.12.1/api/org/apache/pig/piggybank/storage/package-summary.html

找到有关贡献的存钱罐的文档