fork-join工作时没有工作线程吗?

时间:2016-11-04 20:58:27

标签: java multithreading java.util.concurrent fork-join forkjoinpool

我有一个在生产中出现两次的错误,现在我的一个fork / join池停止工作,即使它有工作要做并且正在添加更多工作。

这是我到目前为止的结论,用于解释为什么要完成的任务队列正在填满,任务结果的流程正在停止。我有线程转储,我的任务生成器线程正在等待fork / join提交完成,但没有ForkJoinPool工作线程做任何事情。

"calc-scheduling-pool-4-thread-2" #65 prio=5 os_prio=0  tid=0x00000000102e39f0 nid=0x794a in Object.wait() [0x00002ad900a06000]
   java.lang.Thread.State: WAITING (on object monitor)
    at java.lang.Object.wait(Native Method)
    at java.util.concurrent.ForkJoinTask.externalAwaitDone(ForkJoinTask.java:334)
    - locked <0x000000061ad08708> (a com.....Engine$Calculation)
    at java.util.concurrent.ForkJoinTask.doJoin(ForkJoinTask.java:391)
    at java.util.concurrent.ForkJoinTask.join(ForkJoinTask.java:719)
    at java.util.concurrent.ForkJoinPool.invoke(ForkJoinPool.java:2613)
    at com...Engine.calculateSinceLastBatch(Engine.java:141)

不管我在做什么,这不应该发生吗?线程转储是在检测到初始条件后的数小时内。我在运行时有两个其他ForkJoinPools正常运行,存在许多工作线程。

这个池的并行性是1(我知道这很愚蠢,但不应该破坏fork / join池的正确性)。在我的任务队列填满并且线程转储显示没有工作人员之前,没有检测到任何错误或异常。

有没有人见过这个?要么我错过了某些东西,要么fork / join中存在一个从未(重新)为我启动工作线程的错误。

运行时是java 8

使用代码更新

这是我们在生产中使用fork / join的合理简化。我们有三个引擎,其中只有一个配置为1的并行性。

import java.util.*;
import java.util.concurrent.*;
import java.util.concurrent.atomic.AtomicInteger;
import java.util.stream.*;

public class Engine {

    BlockingQueue<Calculation> externalQueue = new LinkedBlockingQueue<>(100000);
    ScheduledExecutorService scheduling = Executors.newScheduledThreadPool(3);
    static ForkJoinPool forkJoin = new ForkJoinPool(1);

    public static void main(String[] args) {
        new Engine().start();
    }

    void start() {
        final AtomicInteger batch = new AtomicInteger(0);
        // data comes in from external systems
        scheduling.scheduleWithFixedDelay(
                () -> produceData(batch.getAndIncrement()),
                500,
                500,
                TimeUnit.MILLISECONDS);
        // internal scheduling processes data with a fixed delay
        scheduling.scheduleWithFixedDelay(
                this::calculate,
                1000,
                1000,
                TimeUnit.MILLISECONDS);
    }

    void produceData(final int batch) {
        System.out.println(Thread.currentThread().getName() + " => submitting data for batch " + batch);
        Stream<Integer> data = IntStream.range(0, 10).boxed();
        data.map((i) -> new Calculation(batch, i)).forEach(externalQueue::offer);
    }

    void calculate() {
        int available = externalQueue.size();
        List<Calculation> tasks = new ArrayList<>(available);
        externalQueue.drainTo(tasks);
        // invoke will block for the results to be calculated before continuing
        forkJoin.invoke(new CalculationTask(tasks, 0, tasks.size()));
        System.out.println("done with calculations at " + new Date());
    }

    static class CalculationTask extends RecursiveAction {

        static int MIN_CALCULATION_THRESHOLD = 3;

        List<Calculation> tasks;
        int start;
        int end;

        CalculationTask(List<Calculation> tasks, int start, int end) {
            this.tasks = tasks;
            this.start = start;
            this.end = end;
        }

        // if below a threshold, calculate here, else fork to new CalculationTasks
        @Override
        protected void compute() {
            int work = end - start;
            if (work <= threshold()) {
                for (int i = start; i < end; i++) {
                    Calculation calc = tasks.get(i);
                    calc.calculate();
                }
                return;
            }

            invokeNewActions();
        }

        int threshold() {
            return Math.max(tasks.size() / forkJoin.getParallelism() / 2, MIN_CALCULATION_THRESHOLD);
        }

        void invokeNewActions() {
            invokeAll(
                    new CalculationTask(tasks, start, middle()),
                    new CalculationTask(tasks, middle(), end));
        }

        int middle() {
            return (start + end) / 2;
        }
    }

    static class Calculation {

        int batch;
        int data;

        Calculation(int batch, int data) {
            this.batch = batch;
            this.data = data;
        }

        void calculate() {
            // does some work and pushes results to a listener
            System.out.println(Thread.currentThread().getName() + " => calculation complete on batch " + batch
                            + " for " + data);
        }
    }

}

1 个答案:

答案 0 :(得分:0)

等待是在java.util.concurrent.ForkJoinTask.externalAwaitDone(ForkJoinTask.java:334)

这告诉我F / J可能正在使用您的提交线程作为工作人员。 按照invokeAll中的代码。任务提交执行后,代码需要Future,最终结束 ((ForkJoinTask)futures.get(i))的quietlyJoin(); 安静地走进去做。

在那里,如果(Thread.currentThread())instanceof ForkJoinWorkerThread)如果池使用您的提交线程作为工作者,则不会为true,它最终会在externalAwaitDone()中结束。

问题可能是您的提交线程永远不会醒来,因为它不是真正的工作者。使用提交线程作为工作者存在许多问题,这可能是另一个问题。

正如@ John-Vint所说,没有测试,这个答案只是猜测。为什么不设置并行度&gt; 1并完成它。