发现没有的猪案例声明。在特定时期内的事件。
有一个数据集就像电影数据库一样,带有电影,评级,电影的持续时间,发行年份。 问题是你如何找到不。跨越10年的电影? 数据集以逗号分隔。
答案 0 :(得分:0)
year_count = FOREACH movie GENERATE (case when year>2000 and year<2010 then 1 else 0 end) as year_flag,movie_name;
year_grp = GROUP year_count BY year_flag;
movie_count_out = FOREACH year_grp GENERATE group,COUNT(year_flag);
上面的示例可以帮助您理解解决方案,可能存在一些语法错误。如果您需要在十年的基础上进行分组,那么您可以在年末使用子字符串函数并获得特定范围。
答案 1 :(得分:0)
Movie = load'/home/movie/movies.txt'使用PigStorage(',')为(movieid:int,moviename:chararray,yearrelease:int,ratingofmovie:float,moviedurationinsec:float);
movies_released_between_2000_2010 =过滤电影by yearofrelease&gt; 2000 and yearofrelease&lt; 2010;
result = foreach movies_released_between_2000_2010生成moviename,yearofrelease;
转储结果;