在数据流入之前所有来源都准备就绪整个Flink作业/数据流

时间:2018-06-15 18:39:40

标签: apache-flink flink-streaming

如果我们的数据流/作业中有多个来源,并且其中一些来源RichSourceFunction,我们是否可以假设这些来源中的RichSourceFunction.open将被调用并完成,然后才会有任何数据进入此整个数据流(通过众多来源中的任何一个) - 即使源分布在不同的任务管理器上

1 个答案:

答案 0 :(得分:1)

Flink保证在将第一个记录传递给该实例之前调用函数实例的open()方法。保证仅限于函数实例,即,可能发生函数实例的open()方法尚未被调用,而另一个函数实例(相同或另一个函数)已经开始处理记录。

Flink不会跨函数实例全局协调open()次调用。