我们有一个由不同团队管理的Flink集群。群集在多个作业之间共享。因此,在任何特定时间,任何任务管理器都有运行不同工作的插槽。我几乎没有问题 -
答案 0 :(得分:0)
我建议使用Flink的作业模式,每个作业都有一个专用的Flink群集。这会让你的工作孤立,而且恶意的Flink工作将无法阻止你的其他工作。
如果作业因任务失败而失败,则不会影响在同一TaskManager
上执行的其他作业。
如果TaskManager
失败,则所有当前执行的任务都将失败。因此,在TaskManager
上执行至少一个任务的所有作业都将失败,然后需要恢复。目前,无法在共享群集上强制执行每个作业隔离。但是,有JIRA issue尝试通过引入作业级标记来解决此问题。这些标签可用于控制属于不同作业的任务的调度。