Java 8并行流如何在抛出的异常中运行?

时间:2016-11-14 13:42:52

标签: exception exception-handling parallel-processing java-8 java-stream

Java 8并行流如何在consume子句中的抛出异常上运行,例如在forEach处理中?例如,以下代码:

final AtomicBoolean throwException = new AtomicBoolean(true);
IntStream.range(0, 1000)
    .parallel()
    .forEach(i -> {
        // Throw only on one of the threads.
        if (throwException.compareAndSet(true, false)) {
            throw new RuntimeException("One of the tasks threw an exception. Index: " + i);
        });

是否立即停止处理元素?是否等待已经启动的元素完成?是否等待所有流完成?在抛出异常后它是否开始处理流元素?

什么时候回来?异常后立即?在所有/部分元素由消费者处理之后?

在并行流引发异常后,是否继续处理元素? (发现这种情况发生的情况)。

这里有一般规则吗?

编辑(2016年11月15日)

尝试确定并行流是否提前返回,我发现它不是确定的:

@Test
public void testParallelStreamWithException() {
    AtomicInteger overallCount = new AtomicInteger(0);
    AtomicInteger afterExceptionCount = new AtomicInteger(0);
    AtomicBoolean throwException = new AtomicBoolean(true);

    try {
        IntStream.range(0, 1000)
            .parallel()
            .forEach(i -> {
                overallCount.incrementAndGet();
                afterExceptionCount.incrementAndGet();
                try {
                    System.out.println(i + " Sleeping...");
                    Thread.sleep(1000);
                    System.out.println(i + " After Sleeping.");
                }
                catch (InterruptedException e) {
                    e.printStackTrace();
                }
                // Throw only on one of the threads and not on main thread.
                if (!Thread.currentThread().getName().equals("main") && throwException.compareAndSet(true, false)) {
                    System.out.println("Throwing exception - " + i);
                    throw new RuntimeException("One of the tasks threw an exception. Index: " + i);
                }
            });
        Assert.fail("Should not get here.");
    }
    catch (Exception e) {
        System.out.println("Cought Exception. Resetting the afterExceptionCount to zero - 0.");
        afterExceptionCount.set(0);
    }
    System.out.println("Overall count: " + overallCount.get());
    System.out.println("After exception count: " + afterExceptionCount.get());
}
不从主线程投掷时

延迟返回。这会导致在抛出异常后处理很多 new 元素。在我的机器上,抛出异常后处理了大约200个元素。但是,并非所有1000个元素都得到了处理。那么这里的规则是什么?为什么即使抛出异常也会处理更多元素?

删除not(!)符号时,

提前返回,导致在主线程中抛出异常。只有已经启动的元素已完成处理,并且没有处理新的元素。这里的情况很早就回来了。与以前的行为不一致。

我在这里缺少什么?

1 个答案:

答案 0 :(得分:4)

当其中一个阶段抛出异常时,它不会等待其他操作完成,异常会重新抛出给调用者。 这就是ForkJoinPool处理它的方式。

相比之下,findFirst例如并行运行时,只有在所有操作完成处理后才会将结果呈现给调用者(即使在需要完成所有操作之前已知结果)。

换句话说:它会提前返回,但会完成所有正在运行的任务。

编辑回答最后的评论

霍尔格的答案(评论中的链接)对此进行了解释,但这里有一些细节。

1)当杀死所有BUT主线程时,你也杀死了应该由这些线程处理的所有任务。所以这个数字应该实际上大约250,因为有1000个任务和4个线程,我假设它返回3?:

int result = ForkJoinPool.getCommonPoolParallelism();

理论上有1000个任务,有4个线程,每个应该处理250个任务,然后你杀掉其中3个,意味着750个任务丢失。 剩下250个任务要执行,ForkJoinPool将跨越3个新线程来执行这250个左任务。

您可以尝试一些方法,像这样更改您的流(使流不大):

IntStream.generate(random::nextInt).limit(1000).parallel().forEach

这一次,会有更多的操作结束,因为初始拆分索引是未知的,并由其他策略选择。您还可以尝试改变这一点:

 if (!Thread.currentThread().getName().equals("main") && throwException.compareAndSet(true, false)) {

到此:

 if (!Thread.currentThread().getName().equals("main")) {

这次你总是会杀死除main之外的所有线程,直到某个点,ForkJoinPool不会创建新线程,因为任务太小而无法拆分,因此不需要其他线程。在这种情况下,更少的任务将完成。

2)你的第二个例子,当你实际杀死主线程时,就像代码的方式一样,你将看不到其他线程的实际运行。改变它:

    } catch (Exception e) {
        System.out.println("Cought Exception. Resetting the afterExceptionCount to zero - 0.");
        afterExceptionCount.set(0);
    }

    // give some time for other threads to finish their work. You could play commenting and de-commenting this line to see a big difference in results. 
    TimeUnit.SECONDS.sleep(60);

    System.out.println("Overall count: " + overallCount.get());
    System.out.println("After exception count: " + afterExceptionCount.get());