使用Pig

时间:2017-08-05 15:03:39

标签: apache-pig

我在猪中有一个简单的代码,我想每年提取电影的数量,我在电影中加载了文件的内容,我输入了这段代码:

groupingyear = group movies by year;
vrar = foreach groupingyear generate movies.year, COUNT(movies.year); 

结果很好!但是我想得到(年份,电影数量)结构,而不是这种结构:(为什么这些年来写了很多次?)

enter image description here

1 个答案:

答案 0 :(得分:1)

您正在计算年数。假设您的电影数据集中有一个字段movie_name。

groupingyear = group movies by year;
vrar = foreach groupingyear generate group, COUNT(movies.movie_name);