应用错误收集

假设我们有2个工作经理（用于HA的ZooKeeper）和3个任务经理。我已经为检查点配置了FsStateBackend。我假设FsStateBackend在每个任务管理器中运行，从而在内存中保持状态。在检查点上，状态将保留在我们已配置的路径中（文件：/数据）。基本上，我已经配置了指向本地文件系统的路径。因此，每个任务管理器都有其自己的本地磁盘存储，这些存储了检查点数据。据我了解，少量元数据会在检查点发送给作业管理器。

如果任务管理器之一崩溃了怎么办？确保可以在任何可用的任务管理器中启动任务。由于任务管理器（崩溃的任务管理器）检查点数据不可用，因为它已关闭，因此如何恢复作业状态？检查点进程是否将状态信息发送到作业管理器？
任务管理器在检查点期间发送给作业管理器的元数据是什么？
我们使用的文件系统是否应该处于分布式状态？例如。 NFS，S3。如果我们使用系统本地存储进行检查点会发生什么情况。

谢谢

Apache Flink-FsStateBackend-在任务管理器发生故障的情况下如何恢复状态，该状态将状态存储在其本地文件系统中

1 个答案: