在Apache-Pig中输出JSON数组

时间:2014-10-02 21:38:40

标签: json hadoop apache-pig

我想输出json,如下所示,

{"item":330,"genre":["food", "plant"]}

使用

a = LOAD 'genres.csv' USING PigStorage(',') AS (item:int, genre:chararray);
b = GROUP a BY item;
c = FOREACH b GENERATE group, a.genre;
STORE c INTO 'apps_genres.csv' USING JsonStorage();

创建psuedo-json

{"item":330,"genre":"(food,plant)"}

在数组的位置使用字符串。 BagToTuple()导致错误。解决方案是什么?

修改

我把它颠倒了,BagToTuples()创建了伪json,它的缺席导致了错误。错误仍然反映在上面。

0 个答案:

没有答案