我们想知道是否有人对Apache Flink在长寿状态(白天,几周,几个月)中的表现有任何经验。
问题
我们的业务被要求提供近乎实时的订单/运输流程分析。在我们的场景中,这些过程可能会运行一段时间。订单完成并发货可能需要几个月的时间。我们想提供一些检查,例如因时间限制或缺少活动。
需要验证的想法
我们认为将这些检查作为Apache Flink作业实施可能是个好主意。正如我们有长寿状态一样,利用Apache Flink状态后端并等待(有时是几个月)直到订单完成是一个好主意? 我发现了有关Google数据流的类似问题:Long lived state with Google Dataflow 由于Dataflow正在成为Beam,对于这种情况,它可能是更好的编程模型吗?