我正在AWS EMR集群和必需的EC2服务器上运行Gobblin作业。地精工作正在摄取Kafka数据。我将Gobblin作业配置为COMMIT_ON_FULL_SUCCESS。有时,卡夫卡会在短时间内失败,这将导致Gobblin作业的几个任务使所有重试失败(当前设置为三个重试,所有重试都在相对较短的时间内完成)。但是作业将一直运行(可能持续数小时),直到所有任务都完成为止,此时作业将失败(不提交),因为它被设置为仅在完全成功时才提交。有一个方法可以使Gobblin作业一旦单个任务失败而导致所有重试失败,因为该作业在那时注定不会继续执行,因此该尝试会失败吗?还是有办法分散重试次数(例如,超过一个小时),以便在纠正卡夫卡故障后有更大的成功机会?