我正在并行执行spring batch job并使用SimpleAsyncTaskExecutor进行并行处理,并将throttle-limit设置为default(默认为4)。 项目阅读器正在从文本文件中读取行,然后进行处理。 但是正在发生的事情是文本文件中的一行正在处理4个不同的线程,使其在4个单元中执行4次。
下面是我的batch.xml:
<?xml version="1.0" encoding="UTF-8"?>
<beans xmlns="http://www.springframework.org/schema/beans"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.springframework.org/schema/batch http://www.springframework.org/schema/batch/spring-batch.xsd
http://www.springframework.org/schema/beans http://www.springframework.org/schema/beans/spring-beans.xsd">
<import resource="classpath*:/META-INF/spring/batch/override/**/*.xml" />
<bean id="businessReader" class="com.rbsgbm.rates.eodtasks.batch.reader.BusinessItemReader"/>
<bean id="businessProcessor" class="com.rbsgbm.rates.eodtasks.batch.processor.BusinessItemProcessor" />
<bean id="businessWriter" class="com.rbsgbm.rates.eodtasks.batch.writer.BusinessItemWriter" />
<bean id="deskReader" class="com.rbsgbm.rates.eodtasks.batch.reader.DeskItemReader"/>
<bean id="deskProcessor" class="com.rbsgbm.rates.eodtasks.batch.processor.DeskItemProcessor" />
<bean id="deskWriter" class="com.rbsgbm.rates.eodtasks.batch.writer.DeskItemWriter" />
<bean class="com.rbsgbm.rates.eodtasks.batch.Tasklet.TradeSnapTasklet" id="tradeSnapTasklet"/>
<bean class="com.rbsgbm.rates.eodtasks.batch.Tasklet.FoundryExtractTasklet" id="foundryExtractTasklet"/>
<bean id="simpleFireTasklet"
class="com.rbsgbm.rates.eodtasks.batch.Tasklet.SimpleFireTasklet" />
<bean id="mdxMarketDataSnapTasklet"
class="com.rbsgbm.rates.eodtasks.batch.Tasklet.MdxMarketDataSnapTasklet" />
<bean id="stepListener" class="org.springframework.batch.core.listener.StepExecutionListenerSupport" />
<bean id="restartJobListener" class="com.rbsgbm.rates.eodtasks.batch.listener.RestartListener"/>
<bean id="failedStepListener" class="com.rbsgbm.rates.eodtasks.batch.listener.FailedStepStepExecutionListener"/>
<bean id="taskExecutor"
class="org.springframework.core.task.SimpleAsyncTaskExecutor">
</bean>
<job id="simpleDojJob" xmlns="http://www.springframework.org/schema/batch">
<step id="processBusiness" next="simpleFireTask">
<tasklet>
<chunk reader="businessReader" processor="businessProcessor"
writer="businessWriter" commit-interval="1" />
</tasklet>
</step>
<step id="simpleFireTask" next="foundryTask">
<tasklet task-executor="taskExecutor">
<chunk reader="deskReader" processor="deskProcessor"
writer="deskWriter" commit-interval="1" />
</tasklet>
</step>
<step id="foundryTask">
<tasklet ref="foundryExtractTasklet"/>
<listeners>
<listener ref="stepListener"/>
<listener ref="restartJobListener"/>
<listener ref="failedStepListener"/>
</listeners>
</step>
</job>
</beans>
答案 0 :(得分:2)
如果你想拥有线程安全的读者和写作者,你必须以这种方式实现它们。
默认情况下,每个线程都可能在同一时刻访问您的读者或编写器的同一个实例。如果没有为您的读者和编写者实现,它将无法正确处理它。
确保它们是线程安全的最简单的方法是将reader和writer方法分别标记为synchronized。
如果您无法更改Reader / Writer的代码,只需实现一个简单的Wrapper并委托给您的Reader / Writer:
public class SynchronizedItemReader<T> implements ItemReader<T>
{
private ItemReader<T> delegate;
public void setDelegate(ItemReader<T> delegate) {this.delegate = delegate};
public synchronized T read() {
return delegate.read();
}
}
但请注意:如果您还实现了ItemStream来跟踪编写器已成功提交的内容(因此能够在该位置重新启动),您还需要管理它,因为块可以相互超越。