如何有效地计算一个来源的多flink流结果

时间:2018-09-05 06:55:12

标签: apache-flink

例如:

有一个视频播放日志,格式为:  user_id,video_id,play_duration,video_duration,国家/地区,request_date

我要计算:

a。最后一分钟的比赛次数

b。今天的比赛次数

c。过去一个小时内播放次数排名前10的视频

d。最近一小时内最活跃的用户(播放时间)前10名

在上述4个任务中,它们使用相同的源,但是具有三个不同的时间窗口。 是否有任何有效的解决方案来完成这些工作,而无需启动3或4个工作来重复消耗。

1 个答案:

答案 0 :(得分:0)

您可以有一个单独的作业,该作业将流分为4种方式,然后将这些窗口运算符之一附加到每个重复的流上。您可以使用分割/选择或side outputs进行分割。