发现没有的猪案例声明。在特定时期的事件

时间:2016-03-11 11:40:18

标签: hadoop mapreduce apache-pig

发现没有的猪案例声明。在特定时期内的事件。

有一个数据集就像电影数据库一样,带有电影,评级,电影的持续时间,发行年份。 问题是你如何找到不。跨越10年的电影? 数据集以逗号分隔。

2 个答案:

答案 0 :(得分:0)

year_count = FOREACH movie GENERATE (case when year>2000 and year<2010 then 1 else 0 end) as year_flag,movie_name;
year_grp = GROUP year_count BY year_flag;
movie_count_out = FOREACH year_grp GENERATE group,COUNT(year_flag);

上面的示例可以帮助您理解解决方案,可能存在一些语法错误。如果您需要在十年的基础上进行分组,那么您可以在年末使用子字符串函数并获得特定范围。

答案 1 :(得分:0)

Movie = load'/home/movie/movies.txt'使用PigStorage(',')为(movieid:int,moviename:chararray,yearrelease:int,ratingofmovie:float,moviedurationinsec:float);

movies_released_between_2000_2010 =过滤电影by yearofrelease&gt; 2000 and yearofrelease&lt; 2010;

result = foreach movies_released_between_2000_2010生成moviename,yearofrelease;

转储结果;