apache-kafka - 如何在单个任务失败后立即使地精工作失败

我正在AWS EMR集群和必需的EC2服务器上运行Gobblin作业。地精工作正在摄取Kafka数据。我将Gobblin作业配置为COMMIT_ON_FULL_SUCCESS。有时，卡夫卡会在短时间内失败，这将导致Gobblin作业的几个任务使所有重试失败（当前设置为三个重试，所有重试都在相对较短的时间内完成）。但是作业将一直运行（可能持续数小时），直到所有任务都完成为止，此时作业将失败（不提交），因为它被设置为仅在完全成功时才提交。有一个方法可以使Gobblin作业一旦单个任务失败而导致所有重试失败，因为该作业在那时注定不会继续执行，因此该尝试会失败吗？还是有办法分散重试次数（例如，超过一个小时），以便在纠正卡夫卡故障后有更大的成功机会？

如何在单个任务失败后立即使地精工作失败

0 个答案: