我有一个在生产中出现两次的错误,现在我的一个fork / join池停止工作,即使它有工作要做并且正在添加更多工作。
这是我到目前为止的结论,用于解释为什么要完成的任务队列正在填满,任务结果的流程正在停止。我有线程转储,我的任务生成器线程正在等待fork / join提交完成,但没有ForkJoinPool工作线程做任何事情。
"calc-scheduling-pool-4-thread-2" #65 prio=5 os_prio=0 tid=0x00000000102e39f0 nid=0x794a in Object.wait() [0x00002ad900a06000]
java.lang.Thread.State: WAITING (on object monitor)
at java.lang.Object.wait(Native Method)
at java.util.concurrent.ForkJoinTask.externalAwaitDone(ForkJoinTask.java:334)
- locked <0x000000061ad08708> (a com.....Engine$Calculation)
at java.util.concurrent.ForkJoinTask.doJoin(ForkJoinTask.java:391)
at java.util.concurrent.ForkJoinTask.join(ForkJoinTask.java:719)
at java.util.concurrent.ForkJoinPool.invoke(ForkJoinPool.java:2613)
at com...Engine.calculateSinceLastBatch(Engine.java:141)
不管我在做什么,这不应该发生吗?线程转储是在检测到初始条件后的数小时内。我在运行时有两个其他ForkJoinPools正常运行,存在许多工作线程。
这个池的并行性是1(我知道这很愚蠢,但不应该破坏fork / join池的正确性)。在我的任务队列填满并且线程转储显示没有工作人员之前,没有检测到任何错误或异常。
有没有人见过这个?要么我错过了某些东西,要么fork / join中存在一个从未(重新)为我启动工作线程的错误。
运行时是java 8
使用代码更新
这是我们在生产中使用fork / join的合理简化。我们有三个引擎,其中只有一个配置为1的并行性。
import java.util.*;
import java.util.concurrent.*;
import java.util.concurrent.atomic.AtomicInteger;
import java.util.stream.*;
public class Engine {
BlockingQueue<Calculation> externalQueue = new LinkedBlockingQueue<>(100000);
ScheduledExecutorService scheduling = Executors.newScheduledThreadPool(3);
static ForkJoinPool forkJoin = new ForkJoinPool(1);
public static void main(String[] args) {
new Engine().start();
}
void start() {
final AtomicInteger batch = new AtomicInteger(0);
// data comes in from external systems
scheduling.scheduleWithFixedDelay(
() -> produceData(batch.getAndIncrement()),
500,
500,
TimeUnit.MILLISECONDS);
// internal scheduling processes data with a fixed delay
scheduling.scheduleWithFixedDelay(
this::calculate,
1000,
1000,
TimeUnit.MILLISECONDS);
}
void produceData(final int batch) {
System.out.println(Thread.currentThread().getName() + " => submitting data for batch " + batch);
Stream<Integer> data = IntStream.range(0, 10).boxed();
data.map((i) -> new Calculation(batch, i)).forEach(externalQueue::offer);
}
void calculate() {
int available = externalQueue.size();
List<Calculation> tasks = new ArrayList<>(available);
externalQueue.drainTo(tasks);
// invoke will block for the results to be calculated before continuing
forkJoin.invoke(new CalculationTask(tasks, 0, tasks.size()));
System.out.println("done with calculations at " + new Date());
}
static class CalculationTask extends RecursiveAction {
static int MIN_CALCULATION_THRESHOLD = 3;
List<Calculation> tasks;
int start;
int end;
CalculationTask(List<Calculation> tasks, int start, int end) {
this.tasks = tasks;
this.start = start;
this.end = end;
}
// if below a threshold, calculate here, else fork to new CalculationTasks
@Override
protected void compute() {
int work = end - start;
if (work <= threshold()) {
for (int i = start; i < end; i++) {
Calculation calc = tasks.get(i);
calc.calculate();
}
return;
}
invokeNewActions();
}
int threshold() {
return Math.max(tasks.size() / forkJoin.getParallelism() / 2, MIN_CALCULATION_THRESHOLD);
}
void invokeNewActions() {
invokeAll(
new CalculationTask(tasks, start, middle()),
new CalculationTask(tasks, middle(), end));
}
int middle() {
return (start + end) / 2;
}
}
static class Calculation {
int batch;
int data;
Calculation(int batch, int data) {
this.batch = batch;
this.data = data;
}
void calculate() {
// does some work and pushes results to a listener
System.out.println(Thread.currentThread().getName() + " => calculation complete on batch " + batch
+ " for " + data);
}
}
}
答案 0 :(得分:0)
等待是在java.util.concurrent.ForkJoinTask.externalAwaitDone(ForkJoinTask.java:334)
这告诉我F / J可能正在使用您的提交线程作为工作人员。 按照invokeAll中的代码。任务提交执行后,代码需要Future,最终结束 ((ForkJoinTask)futures.get(i))的quietlyJoin(); 安静地走进去做。
在那里,如果(Thread.currentThread())instanceof ForkJoinWorkerThread)如果池使用您的提交线程作为工作者,则不会为true,它最终会在externalAwaitDone()中结束。
问题可能是您的提交线程永远不会醒来,因为它不是真正的工作者。使用提交线程作为工作者存在许多问题,这可能是另一个问题。
正如@ John-Vint所说,没有测试,这个答案只是猜测。为什么不设置并行度&gt; 1并完成它。