如果我们的数据流/作业中有多个来源,并且其中一些来源RichSourceFunction
,我们是否可以假设这些来源中的RichSourceFunction.open
将被调用并完成,然后才会有任何数据进入此整个数据流(通过众多来源中的任何一个) - 即使源分布在不同的任务管理器上?
答案 0 :(得分:1)
Flink保证在将第一个记录传递给该实例之前调用函数实例的open()
方法。保证仅限于函数实例,即,可能发生函数实例的open()
方法尚未被调用,而另一个函数实例(相同或另一个函数)已经开始处理记录。
Flink不会跨函数实例全局协调open()
次调用。