ExecutorService适用于大量短期任务

时间:2012-09-29 01:00:39

标签: java multithreading performance concurrency threadpool

ExecutorService是否适用于大量非常短暂的任务?我设想在切换到同步等待之前内部尝试忙等待的东西。保持任务的顺序并不重要,但应该可以强制执行内存一致性(所有任务主线程恢复控制之前发生)。

下面发布的测试包含100'000个任务,每个任务连续生成100 double个。它接受线程池的大小作为命令行参数,并始终测试串行版本与并行版本。 (如果没有给出命令行arg,则仅测试串行版本。)并行版本使用固定大小的线程池,任务的分配甚至不是时间测量的一部分。尽管如此,并行版本从不比串行版本更快,我已经尝试了多达80个线程(在具有40个超线程内核的机器上)。为什么呢?

import java.util.ArrayList;
import java.util.Random;
import java.util.concurrent.Callable;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;

public class ExecutorPerfTest {
    public static final int TASKS = 100000;
    public static final int SUBTASKS = 100;

    static final ThreadLocal<Random> R = new ThreadLocal<Random>() {
        @Override
        protected synchronized Random initialValue() {
            return new Random();
        }
    };

    public class SeqTest implements Runnable {
        @Override
        public void run() {
            Random r = R.get();
            for (int i = 0; i < TASKS; i++)
                for (int j = 0; j < SUBTASKS; j++)
                    r.nextDouble();
        }
    }

    public class ExecutorTest implements Runnable {
        private final class RandomGenerating implements Callable<Double> {
            @Override
            public Double call() {
                double d = 0;
                Random r = R.get();
                for (int j = 0; j < SUBTASKS; j++)
                    d = r.nextDouble();
                return d;
            }
        }

        private final ExecutorService threadPool;
        private ArrayList<Callable<Double>> tasks = new ArrayList<Callable<Double>>(TASKS);

        public ExecutorTest(int nThreads) {
            threadPool = Executors.newFixedThreadPool(nThreads);
            for (int i = 0; i < TASKS; i++)
                tasks.add(new RandomGenerating());
        }

        public void run() {
            try {
                threadPool.invokeAll(tasks);
            } catch (InterruptedException e) {
                e.printStackTrace();
            } finally {
                threadPool.shutdown();
            }
        }
    }

    public static void main(String[] args) {
        ExecutorPerfTest executorPerfTest = new ExecutorPerfTest();
        if (args.length > 0)
            executorPerfTest.start(new String[]{});
        executorPerfTest.start(args);
    }

    private void start(String[] args) {
        final Runnable r;
        if (args.length == 0) {
            r = new SeqTest();
        }
        else {
            final int nThreads = Integer.parseInt(args[0]);
            r = new ExecutorTest(nThreads);
        }
        System.out.printf("Starting\n");
        long t = System.nanoTime();
        r.run();
        long dt = System.nanoTime() - t;
        System.out.printf("Time: %.6fms\n", 1e-6 * dt);
    }
}

1 个答案:

答案 0 :(得分:2)

Executors.newFixedThreadPool(nThreads)的调用将创建一个ThreadPoolExecutor,可以从LinkedBlockingQueue中读取任务,即。执行程序中的所有线程将锁定在同一队列上以检索下一个任务。

鉴于每个任务的大小非常小以及您引用的线程/ cpu的数量相对较多,因此很可能您的程序运行缓慢,因为会发生高度的锁争用和上下文切换。

请注意ReentrantLock使用的LinkedBlockingQueue的实现在线程放弃并阻塞之前尝试获取锁定时已经短时间内旋转(最多约1us)。

如果您的用例允许,那么您可能想尝试使用Disruptor模式,请参阅http://lmax-exchange.github.com/disruptor/