我有过去活动时间的数据集
01-12-2015 01:10:10
01-12-2015 01:10:20
01-12-2015 01:10:30
01-12-2015 01:10:40
.... (millions of records)
我想对此timeWindow(Time.seconds(30))
我可以使用TimeExtractor类来获取数据中的EventTime
。但是我如何实现getCurrentWatermark
方法。它应该得到过去的日期和时间
答案 0 :(得分:1)
在您的情况下,最好使用提供的TimeStampAssigners
之一here。
所以我推荐的是这样的:
DataStream<MyEvent> stream = ...
DataStream<MyEvent> withTimestampsAndWatermarks =
stream.assignTimestampsAndWatermarks(new AscendingTimestampExtractor<MyEvent>() {
@Override
public long extractAscendingTimestamp(MyEvent element) {
return element.getCreationTime();
}
});
还要记得设置正确的TimestampCharacteristic
:
env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime);