Flink是否支持地图侧聚合? (批量)

时间:2018-07-11 10:24:35

标签: apache-flink

Spark具有map-side combine的概念,因此您可以执行部分​​聚合,从而减少(双关意想不到的)混洗。

Flink中是否有等同的东西?

1 个答案:

答案 0 :(得分:1)

是的。 Flink提供了多个接口来定义(地图端)组合器。

  • GroupCombineFunction<IN, OUT>将一组输入类型IN的子集组合为一个或多个类型OUT的组合值
  • CombineFunction<IN, OUT>将一组输入类型IN的子集组合为类型OUT的单个值
  • ReduceFunction<T>将类型为T的对组合为类型为T的单个值。此功能自动用于合并(预聚合)和减少(完全聚合)。