虽然我现在意识到Flink支持map-side aggregations in batching,但在流媒体中会发生同样的事情吗?假设我有类似的东西:
Dataset:
(0, 0, "A")
(0, 0, "B")
(0, 1, "C")
(0, 1, "D")
(1, 0, "E")
(1, 0, "F")
(1, 1, "G")
(1, 1, "H")
nonKeyedStream
.keyBy(1)
.keyBy(0)
.reduce(((K, b1, c1),(K, b2, c2)) -> (K, someNumber, c1 + c2))
如何处理?
没有地图端聚合:
使用地图端聚合: