如何理解线程池的状态和工作线程数量

发布时间：2021-10-26 11:25:40 阅读：153 作者：iii 栏目：编程语言

开发者测试专用服务器限时活动，0元免费领，库存有限，领完即止！点击查看>>

本篇内容介绍了“如何理解线程池的状态和工作线程数量”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

Java提供了几种便捷的方法创建线程池，通过这些内置的api就能够很轻松的创建线程池。在java.util.concurrent包中的Executors类，其中的静态方法就是用来创建线程池的：

newFixedThreadPool()：创建一个固定线程数量的线程池，而且线程池中的任务全部执行完成后，空闲的线程也不会被关闭。
newSingleThreadExecutor()：创建一个只有一个线程的线程池，空闲时也不会被关闭。
newCachedThreadPool()：创建一个可缓存的线程池，线程的数量为Integer.MAX_VALUE，空闲线程会临时缓存下来，线程会等待60s还是没有任务加入的话就会被关闭。

Executors类中还有一些创建线程池的方法（jdk8新加的），但是现在这个触极到我的知识盲区了~~

如何理解线程池的状态和工作线程数量

上面那几个方法，其实都是创建了一个ThreadPoolExecutor对象作为返回值，要搞清楚线程池的原理主要还是要分析ThreadPoolExecutor这个类。

ThreadPoolExecutor的构造方法：

public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<runnable> workQueue,
                              ThreadFactory threadFactory,
                              RejectedExecutionHandler handler) {
      ...
    }

ThreadPoolExecutor的构造方法包含以下几个参数：

corePoolSize：核心线程数量，常驻线程池中的线程，即时线程池中没有任务可执行，也不会被关闭。
maximumPoolSize：最大线程数量
keepAliveTime：空闲线程存活时间
unit：空闲线程存活时间的单位
workQueue：工作队列，线程池一下忙不过来，那新来的任务就需要排队，排除中的任务就会放在workQueue中
threadFactory：线程工厂，创建线程用的
handler：RejectedExecutionHandler实例用于在线程池中没有空闲线程能够执行任务，并且workQueue中也容不下任务时拒绝任务时的策略。

ThreadPoolExecutor中的线程统称为工作线程，但有一个小概念是核心线程，核心线程由参数corePoolSize指定，如corePoolSize设置5，那线程池中就会有5条线程常驻线程池中，不会被回收掉，但是也会有例外，如果allowCoreThreadTimeOut为true空闲一段时间后，也会被关闭。

线程的状态和工作线程数量

线程中的状态和工作线程和数量都是由ctl表示，是一个AtomicInteger类型的属性：

 private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));

ctl的高四位为线程的状态，其他位数为工作线程的数量，所以线程中最大的工作线程数量为(2^29)-1。

线程池中的状态有五种：

RUNNING：接收新的任务和处理队列中的任务
SHUTDOWN：不能新增任务，但是会继续处理已经添加的任务
STOP：不能新增任务，不会继续处理已经添加任务
TIDYING：所有的任务已经被终止，工作线程为0
TERMINATED：terminated()方法执行完成

状态码的定义如下：

    private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
    private static final int COUNT_BITS = Integer.SIZE - 3;
    private static final int CAPACITY   = (1 &lt;&lt; COUNT_BITS) - 1;

    // runState is stored in the high-order bits
    private static final int RUNNING    = -1 &lt;&lt; COUNT_BITS;
    private static final int SHUTDOWN   =  0 &lt;&lt; COUNT_BITS;
    private static final int STOP       =  1 &lt;&lt; COUNT_BITS;
    private static final int TIDYING    =  2 &lt;&lt; COUNT_BITS;
    private static final int TERMINATED =  3 &lt;&lt; COUNT_BITS;

创建线程池

如果有面试官问：如何正确的创建线程池？千万不要说使用Executors创建线程，虽然Executors能很方便的创建线程池，但是他提供的静态创建方法会有一些坑。

主要的原因是：maximumPoolSize和workQueue这两个参数

Executors静态方法在创建线程池时，如果maximumPoolSize设置为Integer.MAX_VALUE，这样会导致线程池可以一直要以接收运行任务，可能导致cpu负载过高。

workQueue是一个阻塞队列的实例，用于放置正在等待执行的任务。如果在创建线程种时workQueue实例没有指定任务的容量，那么等待队列中可以一直添加任务，极有可能导致oom。

所以创建线程，最好是根据线程池的用途，然后自己创建线程。

添加任务

调用线程池的execute并不是立即执行任务，线程池内部用经过一顿操作，如：判断核心线程数、是否需要添加到等待队列中。

下来的代码是execute的源码，代码很简洁只有2个if语句：

 public void execute(Runnable command) {
    int c = ctl.get();
    if (workerCountOf(c) &lt; corePoolSize) {
        if (addWorker(command, true))
            return;
        c = ctl.get();
    }
    if (isRunning(c) &amp;&amp; workQueue.offer(command)) {
        int recheck = ctl.get();
        if (! isRunning(recheck) &amp;&amp; remove(command))
            reject(command);
        else if (workerCountOf(recheck) == 0)
            addWorker(null, false);
    }
    else if (!addWorker(command, false))
        reject(command);
}

第一个if，如果当前线程池中的工作线程数量小于corePoolSize，直接创建一个工作线程执行任务
第二个if，当线程池处于运行状态，调用workQueue.offer(command)方法将任务添加到workQueue，否则调用addWorker(command, false)尝试去添加一个工作线程。

整理了一张图，把线程池分为三部分Core Worker、Worker、workQueue：

如何理解线程池的状态和工作线程数量

换一种说法，在调用execute方法时，任务首先会放在Core Worker内，然后才是workQueue，最后才会考虑Worker。

这样做的原因可以保证Core Worker中的任务执行完成后，能立即从workQueue获取下一个任务，而不需要启动别的工作线程，用最少的工作线程办更多的事。

创建工作线程

在execute方法中，有三个地方调用了addWorker。addWorker方法可以分为二部分：

增加工作线程数量
启动工作线程

addWorker的方法签名如下：

private boolean addWorker(Runnable firstTask, boolean core)

firstTask：第一个运行的任务，可以为空。如果为空任务会从workQueue中获取。
core：是否是核心工作线程

增加工作线程数量

    retry:
    for (;;) {
        int c = ctl.get();
        int rs = runStateOf(c);

     		....

        for (;;) {
            int wc = workerCountOf(c);
            
            if (wc &gt;= CAPACITY ||
                wc &gt;= (core ? corePoolSize : maximumPoolSize))
                return false;
                
            if (compareAndIncrementWorkerCount(c))
                break retry;
            c = ctl.get();  // Re-read ctl
            if (runStateOf(c) != rs)
                continue retry;
            // else CAS failed due to workerCount change; retry inner loop
        }
    }

上面代码省略了一部分代码，主要代码都在for循环中，利用CAS锁，安全的完成线程池状态的检查与增加工作线程的数量。其中的compareAndIncrementWorkerCount(c)调用就是将工作线程数量+1。

启动工作线程

增加工作线程的数量后，紧接着就会启动工作线程：

boolean workerStarted = false;
boolean workerAdded = false;
Worker w = null;
try {
    w = new Worker(firstTask);
    final Thread t = w.thread;
    if (t != null) {
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            // Recheck while holding lock.
            // Back out on ThreadFactory failure or if
            // shut down before lock acquired.
            int rs = runStateOf(ctl.get());

            if (rs &lt; SHUTDOWN ||
                (rs == SHUTDOWN &amp;&amp; firstTask == null)) {
                if (t.isAlive()) // precheck that t is startable
                    throw new IllegalThreadStateException();
                workers.add(w);
                int s = workers.size();
                if (s &gt; largestPoolSize)
                    largestPoolSize = s;
                workerAdded = true;
            }
        } finally {
            mainLock.unlock();
        }
        if (workerAdded) {
            t.start();
            workerStarted = true;
        }
    }
} finally {
    if (! workerStarted)
        addWorkerFailed(w);
}

启动工作线程的流程：

创建一个Worker实例, Worker构造方法会使用ThreadFactory创建一个线程

w = new Worker(firstTask);
final Thread t = w.thread;

就不说Worker类的实现了，直接给出构造方法来细品：

Worker(Runnable firstTask) {
    setState(-1); // inhibit interrupts until runWorker
    this.firstTask = firstTask;
    this.thread = getThreadFactory().newThread(this);
}

如果线程池状态是在运行中，或者已经关闭，但工作线程要从workQueue中获取任务，才能添加工作线程

if (rs &lt; SHUTDOWN ||
        (rs == SHUTDOWN &amp;&amp; firstTask == null)) {
        if (t.isAlive()) // precheck that t is startable
            throw new IllegalThreadStateException();
        workers.add(w);
        int s = workers.size();
        if (s &gt; largestPoolSize)
            largestPoolSize = s;
        workerAdded = true;
    }

注意：：当线程池处于SHUTDOWN状态时，它不能接收新的任务，但是可以继续执行未完成的任务。任务是否从workQueue中获取，是根据firstTask判断，每个Worker实例都有一个firstTask 属性，如果这个值为null，工作线程启动的时候就会从workQueue中获取任务，否则会执行firstTask 。

启动线程

调用线程的start方法，启动线程。

 if (workerAdded) {
    t.start();
    workerStarted = true;
}

执行任务

回过头来看一个Worker类的定义：

 private final class Worker extends AbstractQueuedSynchronizer
	implements Runnable{
		Worker(Runnable firstTask) {
            setState(-1); // inhibit interrupts until runWorker
            this.firstTask = firstTask;
            this.thread = getThreadFactory().newThread(this);
        }
      ...
}

Worker类实现了Runnable接口，同时在构造方法中会将this传递给线程，到这里你就知道了Worker实例中有run方法，它会在线程启动后执行：

public void run() {
   runWorker(this);
}

run方法内部接着调用runWorker方法运行任务，在这里才是真正的开始运行任务了：

 final void runWorker(Worker w) {
        Thread wt = Thread.currentThread();
        Runnable task = w.firstTask;
        w.firstTask = null;
        w.unlock(); // allow interrupts
        boolean completedAbruptly = true;
        try {
            while (task != null || (task = getTask()) != null) {
                w.lock();
                // If pool is stopping, ensure thread is interrupted;
                // if not, ensure thread is not interrupted.  This
                // requires a recheck in second case to deal with
                // shutdownNow race while clearing interrupt
                if ((runStateAtLeast(ctl.get(), STOP) ||
                     (Thread.interrupted() &amp;&amp;
                      runStateAtLeast(ctl.get(), STOP))) &amp;&amp;
                    !wt.isInterrupted())
                    wt.interrupt();
                try {
                    beforeExecute(wt, task);
                    Throwable thrown = null;
                    try {
                        task.run();
                    } catch (RuntimeException x) {
                        thrown = x; throw x;
                    } catch (Error x) {
                        thrown = x; throw x;
                    } catch (Throwable x) {
                        thrown = x; throw new Error(x);
                    } finally {
                        afterExecute(task, thrown);
                    }
                } finally {
                    task = null;
                    w.completedTasks++;
                    w.unlock();
                }
            }
            completedAbruptly = false;
        } finally {
            processWorkerExit(w, completedAbruptly);
        }
    }

获取任务

首先将firstTask传递给task临时变量：

Runnable task = w.firstTask;

然后循环检查task或者从workQueue中获取任务：

while (task != null || (task = getTask()) != null) {
	...
}

getTask()稍后再做分析。

运行任务

去掉一些状态检查、异常捕获、和勾子方法调用后，保留最重要的调用task.run()：

 while (task != null || (task = getTask()) != null) {
     ...          
     task.run();
     ...
 }

task其实就是通过调用execute方法传递进来的Runnable实例，也就是你的任务。只不过它可能保存在Worker.firstTask中，或者在workQueue中，保存在哪里在前面的任务添加顺序中已经说明。

从workQueue中获取任务

试想一下如果每个任务执行完成，就关闭掉一个线程那有多浪费资源，这样使用线程池也没有多大的意义。所以线程的主要的功能就是线程复用，一旦任务执行完成直接去获取下一个任务，或者挂起线程等待下一个提交的任务，然后等待一段时间后还是没有任务提交，然后才考虑是否关闭部分空闲的线程。

runWorker中会循环的获取任务：

 while (task != null || (task = getTask()) != null) {
     ...          
     task.run();
     ...
 }

上面的代码getTask()就是从workQueue中获取任务：

  private Runnable getTask() {
        boolean timedOut = false; // Did the last poll() time out?

        for (;;) {
        			...
             int wc = workerCountOf(c);

            // Are workers subject to culling?
            boolean timed = allowCoreThreadTimeOut || wc &gt; corePoolSize;
				 ...
            try {
                Runnable r = timed ?
                    workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
                    workQueue.take();
                if (r != null)
                    return r;
                timedOut = true;
            } catch (InterruptedException retry) {
                timedOut = false;
            }
        }
    }

获取任务的时候会有两种方式：

超时等待获取任务
一直等待任务，直到有新任务

如果allowCoreThreadTimeOut为true，corePoolSize指定的核心线程数量会被忽略，直接使用 workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) 获取任务，否则的话会根据当前工作线程的数量，如果wc > corePoolSize为false则当前会被认为是核心线程，调用workQueue.take()一直等待任务。

工作线程的关闭

还是在runWorker方法中：

 final void runWorker(Worker w) {
        Thread wt = Thread.currentThread();
        Runnable task = w.firstTask;
        w.firstTask = null;
        w.unlock(); // allow interrupts
        boolean completedAbruptly = true;
        try {
            while (task != null || (task = getTask()) != null) {
           
                  task.run();
                       
            }
                 
            completedAbruptly = false;   
        } finally {
            processWorkerExit(w, completedAbruptly);
        }
    }

completedAbruptly变量：标记当前工作线程是正常执行完成，还是异常完成的。completedAbruptly为false可以确定线程池中没有可执行的任务了。

上面代码是简洁后的代码，一个while循环保证不间断的获取任务，没有任务可以执行（task为null）退出循环，最后再才会调用processWorkerExit方法：

 private void processWorkerExit(Worker w, boolean completedAbruptly) {
        if (completedAbruptly) // If abrupt, then workerCount wasn't adjusted
            decrementWorkerCount();

        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            completedTaskCount += w.completedTasks;
            workers.remove(w);
        } finally {
            mainLock.unlock();
        }

        tryTerminate();

        int c = ctl.get();
        if (runStateLessThan(c, STOP)) {
            if (!completedAbruptly) {
                int min = allowCoreThreadTimeOut ? 0 : corePoolSize;
                if (min == 0 &amp;&amp; ! workQueue.isEmpty())
                    min = 1;
                if (workerCountOf(c) &gt;= min)
                    return; // replacement not needed
            }
            addWorker(null, false);
        }
    }

processWorkerExit接收一个Worker实例与completedAbruptly变量。processWorkerExit的大致工作流程：

判断当前工作线程是否异常完成，如果是直接减少工作线程的数量，简单的说就是校正一下工作线程的数量。
增加完成的任务数量，将Worker从workers中移除
tryTerminate() 检查线程池状态，因为线程池可以延迟关闭，如果你调用shutdown方法后不会立即关闭，要等待所有的任务执行完成，所以这里调用tryTerminate()方法，尝试去调用terminated方法。

工作线程完成策略

如果某个工作线程完成，线程池内部会判断是否需要重新启动一个：

//判断线程池状态
if (runStateLessThan(c, STOP)) {
    if (!completedAbruptly) {
    		//获取最小工作线程数量
        int min = allowCoreThreadTimeOut ? 0 : corePoolSize;
        //如果最小工作线程数量为0，但是workQueue中还有任务，那重置最小工作线程数量1
        if (min == 0 &amp;&amp; ! workQueue.isEmpty())
            min = 1;
        //如果当前工作线程数数量大于或等于最小工作线程数量，则不需要启动新的工作线程
        if (workerCountOf(c) &gt;= min)
            return; // replacement not needed
    }
    
    //启动一个新的工作线程
    addWorker(null, false);
}

工作线程完成后有两种处理策略：

对于异常完成的工作线程，直接启动一个新的替换
对于正常完成的工作线程，判断当前工作线程是否足够，如果足够则不需要新启动工作线程

注意： 这里的完成，表示工作线程的任务执行完成，workQueue中也没有任务可以获取了。

线程池的关闭

关闭线程池有可以通过shutdown方法：

public void shutdown() {
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        checkShutdownAccess();
        advanceRunState(SHUTDOWN);
        interruptIdleWorkers();
        onShutdown(); // hook for ScheduledThreadPoolExecutor
    } finally {
        mainLock.unlock();
    }
    tryTerminate();
}

shutdown方法，第一步就是先改变线程池的状态，调用advanceRunState(SHUTDOWN)方法，将线程池当前状态更改为SHUTDOWN，advanceRunState代码如下：

 private void advanceRunState(int targetState) {
        for (;;) {
            int c = ctl.get();
            if (runStateAtLeast(c, targetState) ||
                ctl.compareAndSet(c, ctlOf(targetState, workerCountOf(c))))
                break;
        }
    }

然后立即调用interruptIdleWorkers()方法，interruptIdleWorkers()内部会调用它的重载方法interruptIdleWorkers(boolean onlyOne)同时onlyOne参数传递的false来关闭空闲的线程：

private void interruptIdleWorkers() {
    interruptIdleWorkers(false);
}
    
private void interruptIdleWorkers(boolean onlyOne) {
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            for (Worker w : workers) {
                Thread t = w.thread;
                if (!t.isInterrupted() &amp;&amp; w.tryLock()) {
                    try {
                        t.interrupt();
                    } catch (SecurityException ignore) {
                    } finally {
                        w.unlock();
                    }
                }
                if (onlyOne)
                    break;
            }
        } finally {
            mainLock.unlock();
        }
    }

以上代码会遍历workers中的Worker实例，然后调用线程的interrupt()方法。

什么样的线程才是空闲工作线程？

前面提到过在getTask()中，线程从workQueue中获取任务时会阻塞，被阻塞的线程就是空闲的。

再次回到getTask()的代码中：

  private Runnable getTask() {
        boolean timedOut = false; // Did the last poll() time out?

        for (;;) {
        
	          // Check if queue empty only if necessary.
	            if (rs &gt;= SHUTDOWN &amp;&amp; (rs &gt;= STOP || workQueue.isEmpty())) {
	                decrementWorkerCount();
	                return null;
	            }
        			...
             int wc = workerCountOf(c);

            // Are workers subject to culling?
            boolean timed = allowCoreThreadTimeOut || wc &gt; corePoolSize;
				 ...
            try {
                Runnable r = timed ?
                    workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
                    workQueue.take();
                if (r != null)
                    return r;
                timedOut = true;
            } catch (InterruptedException retry) {
                timedOut = false;
            }
        }
    }

再次分析getTask()中的代码中有一段捕获InterruptedException的代码块，interruptIdleWorkers方法中断线程后，getTask()会捕获中断异常，因为外面是一个for循环，随后代码走到判断线程池状态的地方：

if (rs &gt;= SHUTDOWN &amp;&amp; (rs &gt;= STOP || workQueue.isEmpty())) {
	                decrementWorkerCount();
	                return null;
}

上面的代码的会判断当前线程池状态，如果状态大于STOP或者状态等于SHUTDOWN并且workQueue为空时则返回null，getTask()返回空那么在runWorker中循环就会退出，当前工作线程的任务就完成了，可以退出了：

 final void runWorker(Worker w) {
        Thread wt = Thread.currentThread();
        Runnable task = w.firstTask;
        w.firstTask = null;
        w.unlock(); // allow interrupts
        boolean completedAbruptly = true;
        try {
            while (task != null || (task = getTask()) != null) {
           
                  task.run();
                       
            }
                 
            completedAbruptly = false;   
        } finally {
            processWorkerExit(w, completedAbruptly);
        }
    }

shutdownNow

除了shutdown方法能关闭线程池，还有shutdownNow也可以关闭线程池。它两的区别在于:

shutdownNow会清空workQueue中的任务
shutdownNow还会中止当前正在运行的任务
shutdownNow会使线程进入STOP状态，而shutdown()是SHUTDOWN状态

public List<runnable> shutdownNow() {
        List<runnable> tasks;
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            checkShutdownAccess();
            advanceRunState(STOP);
            interruptWorkers();
            tasks = drainQueue();
        } finally {
            mainLock.unlock();
        }
        tryTerminate();
        return tasks;
    }

上面代码基本流程：

advanceRunState(STOP): 使线程池进行STOP状态，与shutdown()中的一致，只是使用的状态码是STOP
interruptWorkers()：与shutdown()中的一致
drainQueue(): 清空队列

任务是中止执行还是继续执行？

调用shutdownNow()后线程池处于STOP状态，紧接着所有的工作线程都会被调用interrupt方法，如果此时runWorker还在运行会发生什么？

在runWorker有一段代码，就是工作线程中止的重要代码：

 final void runWorker(Worker w) {
        ...
        
         while (task != null || (task = getTask()) != null) {
           
            		if ((runStateAtLeast(ctl.get(), STOP) ||
                     (Thread.interrupted() &amp;&amp;
                      runStateAtLeast(ctl.get(), STOP))) &amp;&amp;
                    !wt.isInterrupted())
                    wt.interrupt();
                    
                  task.run();
                       
            }
        ...
}

重点关注：

if ((runStateAtLeast(ctl.get(), STOP) ||
                     (Thread.interrupted() &amp;&amp;
                      runStateAtLeast(ctl.get(), STOP))) &amp;&amp;
                    !wt.isInterrupted())
                    wt.interrupt();

这个if看起来有点难理解，理解下来大致意思是：如果线程池状态大于等于STOP，立即中断线程，否则清除线程的中断标记，也就是说当线程池状态为RUNNING和SHUTDOWN时，线程的中断标记会被清除（线程的中断代码在interruptWorkers方法中），可以继续执行任务。

以上代码执行完成后，紧接着就会调用task.run()方法，这里面我们自己就可以根据线程的中断标记来判断任务是否被中断。

“如何理解线程池的状态和工作线程数量”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站，小编将为大家输出更多高质量的实用文章！

亿速云「云服务器」，即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘，价格低至29元/月。点击查看>>

向AI问一下细节

如何理解线程池的状态和工作线程数量

线程的状态和工作线程数量

创建线程池

添加任务

创建工作线程

增加工作线程数量

启动工作线程

执行任务

从workQueue中获取任务

工作线程的关闭

工作线程完成策略

线程池的关闭

什么样的线程才是空闲工作线程？

shutdownNow

任务是中止执行还是继续执行？

猜你喜欢

最新资讯

相关推荐

开发者交流群：

相关标签