关于跳过策略实现的春季批处理中的奇怪行为

时间:2012-02-07 10:23:07

标签: spring-batch

我有一个春季批量计划。

跳过限制设置为5,块大小为1000。

我的工作有以下两个步骤:

    <step id="myFileGenerator" next="myReportGenerator">
        <tasklet transaction-manager="jobRepository-transactionManager">
            <chunk reader="myItemReader" processor="myItemProcessor" writer="myItemWriter"  commit-interval="1000" skip-policy="skipPolicy"/>
        </tasklet>
        <listeners>
            <listener ref="mySkipListener"/>
        </listeners>
    </step>

    <step id="myReportGenerator">
        <tasklet ref="myReportTasklet" transaction-manager="jobRepository-transactionManager"/>
    </step> 

跳过政策如下:

<beans:bean id="skipPolicy" class="com.myPackage.util.Skip_Policy">
    <beans:property name="skipLimit" value="5"/>
</beans:bean>

SkipPolicy类如下:

public class Skip_Policy implements SkipPolicy {

private int skipLimit;

public void setSkipLimit(final int skipLimit) {
    this.skipLimit = skipLimit;
}

public boolean shouldSkip(final Throwable t, final int skipCount) throws SkipLimitExceededException {

    if (skipCount < this.skipLimit) {
        return true;
    }
    return false;
}
}

因此,对于在达到跳过限制之前发生的任何错误,跳过策略将忽略该错误(返回true)。达到跳过限制后,作业将因任何错误而失败。

mySkipListener类如下:

public class mySkipListener implements SkipListener<MyItem, MyItem> {

public void onSkipInProcess(final MyItem item, final Throwable t) {
    // TODO Auto-generated method stub
    System.out.println("Skipped details during PROCESS is: " + t.getMessage());
}

public void onSkipInRead(final Throwable t) {

    System.out.println("Skipped details during READ is: " + t.getMessage());
}

public void onSkipInWrite(final MyItem item, final Throwable t) {
    // TODO Auto-generated method stub
    System.out.println("Skipped details during WRITE is: " + t.getMessage());
}
}

现在在myItemProcessor中,我有以下代码块:

if (item.getTheNumber().charAt(4) == '-') {
        item.setProductNumber(item.getTheNumber().substring(0, 3));
    } else {
        item.setProductNumber("55");
    }

对于某些项,theNumber字段为null,因此上面的代码块抛出“StringIndexOutofBounds”异常。

但我看到一种奇怪的行为,我不明白为什么会发生这种行为。

总共有6个项目有错误,即数字字段为空。

如果跳过限制大于错误数(即> 6),则跳过侦听器类中的sys out被调用并且正在报告跳过的错误。

但是,如果跳过限制较少(比如我的示例中的5),则跳过侦听器类中的sys out根本没有被调用,我直接在控制台上获得以下异常转储:

org.springframework.batch.retry.RetryException: Non-skippable exception in recoverer while processing; nested exception is java.lang.StringIndexOutOfBoundsException
at org.springframework.batch.core.step.item.FaultTolerantChunkProcessor$2.recover(FaultTolerantChunkProcessor.java:282)
at org.springframework.batch.retry.support.RetryTemplate.handleRetryExhausted(RetryTemplate.java:416)
at org.springframework.batch.retry.support.RetryTemplate.doExecute(RetryTemplate.java:285)
at org.springframework.batch.retry.support.RetryTemplate.execute(RetryTemplate.java:187)

这种行为背后的原因是什么?我该怎么做才能解决这个问题?

感谢阅读!

1 个答案:

答案 0 :(得分:2)

如果包含它的tasklet正常完成,则SkipListener仅在Chunk的末尾使用。当您有超过跳过限制的错误时,通过您看到的异常报告,并且中止了tasklet。

如果错误数小于跳过限制,则tasklet正常完成,并为每个跳过的行或项调用SkipListener一次 - Spring Batch在内部构建它们的列表,但仅在结束。

如果这是因为如果任务失败你的想法可能会重试它,所以知道在不完整的运行期间跳过的内容是没有用的,每次重试时你都会得到相同的通知。只有在其他一切都成功的情况下,你才能看到被跳过的内容。想象您正在记录跳过的项目,您不希望它们被一次又一次地记录下来。

正如您所看到的,简单的解决方案是使跳过限制足够大。同样的想法是,如果你必须跳过很多项目,可能会有一个更严重的问题。