我想知道在Apache Flink的摄取时间配置中使用了哪个挂钟。
Here,我们读到了摄取时间“一旦到达系统(在源头)”就会将挂钟时间戳分配给记录。
如果源非并行,我认为与传入元组关联的时间戳是完全有序的,但如果我使用并行源函数会怎样? 可能是并行源在2台不同的机器上运行,从而可以使用 2个不同的挂钟来获取时间戳吗?
提前谢谢
答案 0 :(得分:2)
相应机器的挂钟时间用作时间戳。因此,如果未正确同步计算机的时钟,则可能会获得多个不同的时间戳。
如果它们在不同的机器上执行,这也适用于多个源。每个源将使用运行它的机器的时钟来分配时间戳。