为什么要使用线程池？

平时我们在使用多线程的时候，通常都是架构师配置好了线程池的 Bean，我们需要使用的时候，提交一个线程即可，不需要过多关注其内部原理。

在学习一门新的技术之前，我们还是先了解下为什么要使用它，使用它能够解决什么问题：

创建/销毁线程伴随着系统开销，过于频繁的创建/销毁线程，会很大程度上影响处理效率
例如：

记创建线程消耗时间T1，执行任务消耗时间T2，销毁线程消耗时间T3

如果T1+T3>T2，那么是不是说开启一个线程来执行这个任务太不划算了！

正好，线程池缓存线程，可用已有的闲置线程来执行新任务，避免了T1+T3带来的系统开销

线程并发数量过多，抢占系统资源从而导致阻塞
我们知道线程能共享系统资源，如果同时执行的线程过多，就有可能导致系统资源不足而产生阻塞的情况

运用线程池能有效的控制线程最大并发数，避免以上的问题

对线程进行一些简单的管理
比如：延时执行、定时循环执行的策略等

运用线程池都能进行很好的实现

创建一个线程池

在 Java 中，新建一个线程池对象非常简单，Java 本身提供了工具类java.util.concurrent.Executors，可以使用如下代码创建一个固定数量线程的线程池：

ExecutorService service = Executors.newFixedThreadPool(10);

注意：以上代码用来测试还可以，实际使用中最好能够显示地指定相关参数。

我们可以看下其内部源码实现：

public static ExecutorService newFixedThreadPool(int nThreads) {        return new ThreadPoolExecutor(nThreads, nThreads,                                      0L, TimeUnit.MILLISECONDS,                                      new LinkedBlockingQueue
    
     ());    }

在阿里巴巴代码规范中，建议我们自己指定线程池的相关参数，为的是让开发人员能够自行理解线程池创建中的每个参数，根据实际情况，创建出合理的线程池。接下来，我们来剖析下java.util.concurrent.ThreadPoolExecutor的构造方法参数。

ThreadPoolExecutor 浅析

java.util.concurrent.ThreadPoolExecutor有多个构造方法，我们拿参数最多的构造方法来举例，以下是阿里巴巴代码规范中给出的创建线程池的范例：

ThreadPoolExecutor service = new ThreadPoolExecutor(5, 200,                0L, TimeUnit.MILLISECONDS,                new LinkedBlockingQueue<>(1024),                 new ThreadFactoryBuilder().setNameFormat("demo-pool-%d").build(),                 new ThreadPoolExecutor.AbortPolicy());

贴一张IDEA中的图更方便看：

首先最重要的几个参数，可能就是：corePoolSize，maximumPoolSize，workQueue了，先看下这几个参数的解释：

corePoolSize
用于设定 thread pool 需要时刻保持的最小 core threads 的数量，即便这些 core threads 处于空闲状态啥事都不做也不会将它们回收掉，当然前提是你没有设置 allowCoreThreadTimeOut 为 true。至于 pool 是如何做到保持这些个 threads 不死的，我们稍后再说。

maximumPoolSize
用于限定 pool 中线程数的最大值。如果你自己构造了 pool 且传入了一个 Unbounded 的 queue 且没有设置它的 capacity，那么不好意思，最大线程数会永远 <= corePoolSize，maximumPoolSize 变成了无效的。

workQueue
该线程池中的任务队列：维护着等待执行的 Runnable 对象。当所有的核心线程都在干活时，新添加的任务会被添加到这个队列中等待处理，如果队列满了，则新建非核心线程执行任务

由于本文是初步了解线程池，所以先理解这几个参数，上文对于这三个参数的解释，基本上跟JDK源码中的注释一致（java.util.concurrent.ThreadPoolExecutor#execute里的代码）。

我们编写个程序来方便理解：

// 创建线程池ThreadPoolExecutor service = new ThreadPoolExecutor(5, 200,            0L, TimeUnit.MILLISECONDS,            new LinkedBlockingQueue<>(1024),            new ThreadFactoryBuilder().setNameFormat("demo-pool-%d").build(),            new ThreadPoolExecutor.AbortPolicy());// 等待执行的runnable   Runnable runnable = () -> {    try {        TimeUnit.SECONDS.sleep(3);    } catch (InterruptedException e) {        e.printStackTrace();    }};// 启动的任务数量int counts = 1224;for (int i = 0; i < counts; i++) {    service.execute(runnable);}// 监控线程池执行情况的代码 ThreadPoolExecutor tpe = ((ThreadPoolExecutor) service);while (true) {    System.out.println();    int queueSize = tpe.getQueue().size();    System.out.println("当前排队线程数：" + queueSize);    int activeCount = tpe.getActiveCount();    System.out.println("当前活动线程数：" + activeCount);    long completedTaskCount = tpe.getCompletedTaskCount();    System.out.println("执行完成线程数：" + completedTaskCount);    long taskCount = tpe.getTaskCount();    System.out.println("总线程数：" + taskCount);    try {        Thread.sleep(3000);    } catch (InterruptedException e) {        e.printStackTrace();    }}

线程池的容量与我们启动的任务数量息息相关。

已知：

corePoolSize = 5

maximumPoolSize = 200

workQueue.size() = 1024

我们修改同时 execute 添加到线程池的 Runnable 数量 counts：

counts <= corePoolSize：所有的任务均为核心线程执行，没有任何 Runnable 被添加到 workQueue中

当前排队线程数：0当前活动线程数：3执行完成线程数：0总线程数：3

corePoolSize < counts <= corePoolSize + workQueue.size()：所有任务均为核心线程执行，当核心线程处于繁忙状态，则将任务添加到 workQueue 中等待

当前排队线程数：15当前活动线程数：5执行完成线程数：0总线程数：20

corePoolSize + workQueue.size() < counts <= maximumPoolSize + workQueue.size()：corePoolSize 个线程由核心线程执行，超出队列长度 workQueue.size() 的任务，将另启动非核心线程执行

当前排队线程数：1024当前活动线程数：105执行完成线程数：0总线程数：1129

counts > maximumPoolSize + workQueue.size()：将会报异常java.util.concurrent.RejectedExecutionException

java.util.concurrent.RejectedExecutionException: Task com.bwjava.util.ExecutorServiceUtilTest$$Lambda$1/314265080@725bef66 rejected from java.util.concurrent.ThreadPoolExecutor@2aaf7cc2[Running, pool size = 200, active threads = 200, queued tasks = 1024, completed tasks = 0]

线程池踩坑：线程嵌套导致阻塞

这次的踩坑才是我写这篇文章的初衷，借此机会好好了解下线程池的各个概念。本身这段时间在研究爬虫，为了尽量提高爬虫的效率，用到了多线程处理。由于代码写得比较随性，所以遇到了一个阻塞的问题，研究了一下才搞明白，模拟的代码如下：

ThreadPoolExecutor service = new ThreadPoolExecutor(5, 200,        0L, TimeUnit.MILLISECONDS,        new LinkedBlockingQueue<>(1024),        new ThreadFactoryBuilder().setNameFormat("demo-pool-%d").build(),        new ThreadPoolExecutor.AbortPolicy());@Testpublic void testBlock() {    Runnable runnableOuter = () -> {        try {            Runnable runnableInner1 = () -> {                try {                    TimeUnit.SECONDS.sleep(3); // 模拟比较耗时的爬虫操作                } catch (InterruptedException e) {                    e.printStackTrace();                }            };            Future
     submit = service.submit(runnableInner1);            submit.get(); // 实际业务中，runnableInner2需要用到此处返回的参数，所以必须get            Runnable runnableInner2 = () -> {                try {                    TimeUnit.SECONDS.sleep(5); // 模拟比较耗时的爬虫操作                } catch (InterruptedException e) {                    e.printStackTrace();                }            };            Future
     submit2 = service.submit(runnableInner2);            submit2.get();        } catch (InterruptedException | ExecutionException e) {            e.printStackTrace();        }    };    for (int i = 0; i < 20; i++) {        service.execute(runnableOuter);    }    ThreadPoolExecutor tpe = ((ThreadPoolExecutor) service);    while (true) {        System.out.println();        int queueSize = tpe.getQueue().size();        System.out.println("当前排队线程数：" + queueSize);        int activeCount = tpe.getActiveCount();        System.out.println("当前活动线程数：" + activeCount);        long completedTaskCount = tpe.getCompletedTaskCount();        System.out.println("执行完成线程数：" + completedTaskCount);        long taskCount = tpe.getTaskCount();        System.out.println("总线程数：" + taskCount);        try {            Thread.sleep(3000);        } catch (InterruptedException e) {            e.printStackTrace();        }    }}

线程池是前文的线程池，参数完全不变。线程的监控代码也一致。当我们运行这个单元测试的时候，会发现打印出来的结果一直是如下：

当前排队线程数：15当前活动线程数：5执行完成线程数：0总线程数：20当前排队线程数：20当前活动线程数：5执行完成线程数：0总线程数：25当前排队线程数：20当前活动线程数：5执行完成线程数：0总线程数：25……略

根本问题是 Runnable 内部还嵌套了 Runnable ，且他们都提交到了一个线程池。下面分步骤说明问题：

runnableOuter 被提交到了线程池

runnableOuter 开始执行，runnableInner1 被提交到线程池，对 runnableInner1 的结果进行 get，导致runnableOuter 被阻塞
1. 于此同时，更多的 runnableOuter 被提交到线程池，核心线程被 runnableOuter 和 runnableInner1 占满，多余的线程 runnableInner2 被加入 workQueue 中等待执行