使用Pig从Mongo读取未命名的字符串数组

时间:2013-11-12 11:33:20

标签: mongodb load apache-pig

我的记录在mongo中如下所示。

{ "_id" : ObjectId("..."), "gender":"male", "age" : 19, "cars" : ["a", "b", "c"], "first" : "Daniel", "last" : "Alabi" }

{ "_id" : ObjectId("..."), "gender":"male", "age" : 21, "cars" : ["d", "e"], "first" : "Tolu", "last" : "Alabi" }

{ "_id" : ObjectId("..."), "gender":"female", "age" : 50, "cars" : [], "first" : "Tinuke", "last" : "Dada" }

我想将架构作为 'f:chararray,l:chararray,g:chararray,年龄:int,cars:{t :( car:chararray)}' 在猪中加载数据后。

我尝试使用

TEMP = LOAD 'mongodb://localhost:27017/local.temp' USING com.mongodb.hadoop.pig.MongoLoader('first:chararray, last:chararray, age:int, gender:chararray, cars:{(chararray)}');

DESCRIBE TEMP;

我的输出为

(Daniel,Alabi,19,male,)

(Tolu,Alabi,21,male,)

(Tinuke,Dada,50,female,{})

TEMP: {first: chararray,last: chararray,age: int,gender: chararray,cars: {(val_0: chararray)}}

有人可以帮忙写一下load语句吗?

1 个答案:

答案 0 :(得分:0)

看看here

Mongo数组转换为Pig Tuple。