当前位置：

首页
/
IT
/
程序
/
Java
/
Java 并发编程原理与实战三十七: 线程池的原理与使用

Java 并发编程原理与实战三十七: 线程池的原理与使用

一, 简介

线程池在我们的高并发环境下, 实际应用是非常多的!! 适用频率非常高!

有过使用过 Executors 框架的朋友, 可能不太知道底层的实现, 这里就是讲 Executors 是由 ThreadPoolExecutor 实现的. 好的, 让我们来看看 ThreadPollExcutor 是怎样实现的呢?

如果你想了解 ThreadPoolExecutor 的话. 可以先从它的构造方法看起.

ThreadPoolExecutor(corePoolSize, maximumPoolSize, keepAliveTime, unit,workQueue,threadFactory, handler)

corePoolSize 核心线程池大小

maximumPoolSize 线程池最大容量大小

keepAliveTime 线程池空闲时, 线程存活的时间

TimeUnit 时间单位

ThreadFactory 线程工厂

BlockingQueue 任务队列

RejectedExecutionHandler 线程拒绝策略

我相信大家看了注解之后, 前面几个要填的要素, 都没什么问题. ThreadFactory 的话, 用默认的就可以 (或者构造函数不用填写这项目).RejectedExecutionHandler 这里的线程拒绝策略的话, 可能要看看

RejectedExecutionHandler 有哪些拒绝策略呢?

AbortPolicy: 如果线程池队列满了丢掉这个任务并且抛出 RejectedExecutionException 异常.

DiscardPolicy: 如果线程池队列满了, 会直接丢掉这个任务并且不会有任何异常

DiscardOldestPolicy: 如果队列满了, 会将最早进入队列的任务删掉腾出空间, 再尝试加入队列.

CallerRunsPolicy: 如果添加到线程池失败, 那么主线程会自己去执行该任务, 不会等待线程池中的线程去执行. 就像是个急脾气的人, 我等不到别人来做这件事就干脆自己干.

自定义

注意: shutdown() 方法和 shutdownNow() 的区别?

shutdown() 会等待线程全部执行完才执行 shutdown 线程池

shutdownNow() 不会等待线程全部执行完才执行 shutdown 线程池

二, 源码解析

我们现在来看看 ThreadPoolExecutor 的源码是怎么样的, 也许你刚开始看他的源码会很痛苦, 因为你不知道作者为什么是这样设计的, 所以本文就我看到的思想会给你做一个介绍, 此时也许你通过知道了一些作者的思想, 你也许就知道应该该如何去操作了.

这里来看下构造方法中对那些属性做了赋值:

源码段 1:

public ThreadPoolExecutor(int corePoolSize,
                           int maximumPoolSize,
                           long keepAliveTime,
                           TimeUnit unit,
                           BlockingQueue workQueue,
                           ThreadFactory threadFactory,
                           RejectedExecutionHandler handler) {
     if (corePoolSize <0 ||
         maximumPoolSize <= 0 ||
         maximumPoolSize < corePoolSize ||
         keepAliveTime < 0)
         throw new IllegalArgumentException();
     if (workQueue == null || threadFactory == null || handler == null)
         throw new NullPointerException();
     this.corePoolSize = corePoolSize;
     this.maximumPoolSize = maximumPoolSize;
     this.workQueue = workQueue;
     this.keepAliveTime = unit.toNanos(keepAliveTime);
     this.threadFactory = threadFactory;
     this.handler = handler;
 }

这里你可以看到最终赋值的过程, 可以先大概知道下参数的意思:

corePoolSize: 核心运行的 poolSize, 也就是当超过这个范围的时候, 就需要将新的 Thread 放入到等待队列中了;

maximumPoolSize: 一般你用不到, 当大于了这个值就会将 Thread 由一个丢弃处理机制来处理, 但是当你发生: newFixedThreadPool 的时候, corePoolSize 和 maximumPoolSize 是一样的, 而 corePoolSize 是先执行的, 所以他会先被放入等待队列, 而不会执行到下面的丢弃处理中, 看了后面的代码你就知道了.

workQueue: 等待队列, 当达到 corePoolSize 的时候, 就向该等待队列放入线程信息 (默认为一个 LinkedBlockingQueue), 运行中的队列属性为: workers, 为一个 HashSet; 内部被包装了一层, 后面会看到这部分代码.

keepAliveTime: 默认都是 0, 当线程没有任务处理后, 保持多长时间, cachedPoolSize 是默认 60s, 不推荐使用.

threadFactory: 是构造 Thread 的方法, 你可以自己去包装和传递, 主要实现 newThread 方法即可;

handler: 也就是参数 maximumPoolSize 达到后丢弃处理的方法, java 提供了 5 种丢弃处理的方法, 当然你也可以自己弄, 主要是要实现接口: RejectedExecutionHandler 中的方法:

public void rejectedExecution(Runnabler, ThreadPoolExecutor e)

java 默认的是使用: AbortPolicy, 他的作用是当出现这中情况的时候会抛出一个异常; 其余的还包含:

1,CallerRunsPolicy: 如果发现线程池还在运行, 就直接运行这个线程

2,DiscardOldestPolicy: 在线程池的等待队列中, 将头取出一个抛弃, 然后将当前线程放进去.

3,DiscardPolicy: 什么也不做

4,AbortPolicy:java 默认, 抛出一个异常: RejectedExecutionException.

通常你得到线程池后, 会调用其中的: submit 方法或 execute 方法去操作; 其实你会发现, submit 方法最终会调用 execute 方法来进行操作, 只是他提供了一个 Future 来托管返回值的处理而已, 当你调用需要有返回值的信息时, 你用它来处理是比较好的; 这个 Future 会包装对 Callable 信息, 并定义一个 Sync 对象 (), 当你发生读取返回值的操作的时候, 会通过 Sync 对象进入锁, 直到有返回值的数据通知, 具体细节先不要看太多, 继续向下:

来看看 execute 最为核心的方法吧:

源码段 2:

public void execute(Runnable command) {
    if (command == null)
        throw new NullPointerException();
    if (poolSize>= corePoolSize || !addIfUnderCorePoolSize(command)) {
        if (runState == RUNNING && workQueue.offer(command)) {
            if (runState != RUNNING || poolSize == 0)
                ensureQueuedTaskHandled(command);
        }
        else if (!addIfUnderMaximumPoolSize(command))
            reject(command); // is shutdown or saturated
    }
}

这段代码看似简单, 其实有点难懂, 很多人也是这里没看懂, 没事, 我一个 if 一个 if 说:

首先第一个判定空操作就不用说了, 下面判定的 poolSize>= corePoolSize 成立时候会进入 if 的区域, 当然它不成立也有可能会进入, 他会判定 addIfUnderCorePoolSize 是否返回 false, 如果返回 false 就会进去;

我们先来看下 addIfUnderCorePoolSize 方法的源码是什么:

源码段 3:

private boolean addIfUnderCorePoolSize(Runnable firstTask) {
    Thread t = null;
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        if (poolSize <corePoolSize && runState == RUNNING)
            t = addThread(firstTask);
    } finally {
        mainLock.unlock();
    }
    if (t == null)
        return false;
    t.start();
    return true;
}

可以发现, 这段源码是如果发现小雨 corePoolSize 就会创建一个新的线程, 并且调用线程的 start() 方法将线程运行起来: 这个 addThread() 方法, 我们先不考虑细节, 因为我们还要先看到前面是怎么进去的, 这里可以发信啊, 只有没有创建成功 Thread 才会返回 false, 也就是当当前的 poolSize> corePoolSize 的时候, 或线程池已经不是在 running 状态的时候才会出现;

注意: 这里在外部判定一次 poolSize 和 corePoolSize 只是初步判定, 内部是加锁后判定的, 以得到更为准确的结果, 而外部初步判定如果是大于了, 就没有必要进入这段有锁的代码了.

此时我们知道了, 当前线程数量大于 corePoolSize 的时候, 就会进入 [代码段 2] 的第一个 if 语句中, 回到 [源码段 2] , 继续看 if 语句中的内容:

这里标记为

源码段 4:

if (runState == RUNNING && workQueue.offer(command)) {
   if (runState != RUNNING || poolSize == 0)
       ensureQueuedTaskHandled(command);
   }
   else if (!addIfUnderMaximumPoolSize(command))
       reject(command); // is shutdown or saturated

第一个 if, 也就是当当前状态为 running 的时候, 就会去执行 workQueue.offer(command), 这个 workQueue 其实就是一个 BlockingQueue,offer() 操作就是在队列的尾部写入一个对象, 此时写入的对象为线程的对象而已; 所以你可以认为只有线程池在 RUNNING 状态, 才会在队列尾部插入数据, 否则就执行 else if, 其实 else if 可以看出是要做一个是否大于 MaximumPoolSize 的判定, 如果大于这个值, 就会做 reject 的操作, 关于 reject 的说明, 我们在 [源码段 1] 的解释中已经非常明确的说明, 这里可以简单看下源码, 以应征结果:

源码段 5:

private boolean addIfUnderMaximumPoolSize(Runnable firstTask) {
        Thread t = null;
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            if (poolSize <maximumPoolSize && runState == RUNNING)
                // 在 corePoolSize = maximumPoolSize 下, 该代码几乎不可能运行
                t = addThread(firstTask);
        } finally {
            mainLock.unlock();
        }
        if (t == null)
            return false;
        t.start();
        return true;
}
void reject(Runnable command) {
        handler.rejectedExecution(command, this);
    }

也就是如果线程池满了, 而且线程池调用了 shutdown 后, 还在调用 execute 方法时, 就会抛出上面说明的异常: RejectedExecutionException

再回头来看下 [代码段 4] 中进入到等待队列后的操作:

if (runState != RUNNING || poolSize == 0)
                   ensureQueuedTaskHandled(command);

这段代码是要在线程池运行状态不是 RUNNING 或 poolSize == 0 才会调用, 他是干啥呢?

他为什么会不等于 RUNNING 呢? 外面那一层不是判定了他 == RUNNING 了么, 其实有时间差就是了, 如果是 poolSize == 0 也会执行这段代码, 但是里面的判定条件是如果不是 RUNNING, 就做 reject 操作, 在第一个线程进去的时候, 会将第一个线程直接启动起来; 很多人也是看这段代码很绕, 因为不断的循环判定类似的判定条件, 你主要记住他们之间有时间差, 要取最新的就好了.

此时貌似代码看完了? 咦, 此时有问题了:

1, 等待中的线程在后来是如何跑起来的呢? 线程池是不是有类似 Timer 一样的守护进程不断扫描线程队列和等待队列? 还是利用某种锁机制, 实现类似 wait 和 notify 实现的?

2, 线程池的运行队列和等待队列是如何管理的呢? 这里还没看出影子呢!

NO,NO,NO!

Java 在实现这部分的时候, 使用了怪异的手段, 神马手段呢, 还要再看一部分代码才晓得.

在前面 [源码段 3] 中, 我们看到了一个方法叫: addThread(), 也许很少有人会想到关键在这里, 其实关键就是在这里:

我们看看 addThread() 方法到底做了什么.

源码段 6:

private Thread addThread(Runnable firstTask) {
    Worker w = new Worker(firstTask);
    Thread t = threadFactory.newThread(w);
    if (t != null) {
        w.thread = t;
        workers.add(w);
        int nt = ++poolSize;
        if (nt> largestPoolSize)
            largestPoolSize = nt;
    }
    return t;
}

这里创建了一个 Work, 其余的操作, 就是讲 poolSize 叠加, 然后将将其放入 workers 的运行队列等操作;

我们主要关心 Worker 是干什么的, 因为这个 threadFactory 对我们用途不大, 只是做了 Thread 的命名处理; 而 Worker 你会发现它的定义也是一个 Runnable, 外部开始在代码段中发现了调用哪个这个 Worker 的 start() 方法, 也就是线程的启动方法, 其实也就是调用了 Worker 的 run() 方法, 那么我们重点要关心 run 方法是如何处理的

源码段 7:

public void run() {
     try {
         Runnable task = firstTask;
         firstTask = null;
         while (task != null || (task = getTask()) != null) {
             runTask(task);
             task = null;
         }
     } finally {
         workerDone(this);
     }
 }

FirstTask 其实就是开始在创建 work 的时候, 由外部传入的 Runnable 对象, 也就是你自己的 Thread, 你会发现它如果发现 task 为空, 就会调用 getTask() 方法再判定, 直到两者为空, 并且是一个 while 循环体.

那么看看 getTask() 方法的实现为:

源码段 8:

Runnable getTask() {
    for (;;) {
        try {
            int state = runState;
            if (state> SHUTDOWN)
                return null;
            Runnable r;
            if (state == SHUTDOWN)  // Help drain queue
                r = workQueue.poll();
            else if (poolSize> corePoolSize || allowCoreThreadTimeOut)
                r = workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS);
            else
                r = workQueue.take();
            if (r != null)
                return r;
            if (workerCanExit()) {
                if (runState>= SHUTDOWN) // Wake up others
                    interruptIdleWorkers();
                return null;
            }
            // Else retry
        } catch (InterruptedException ie) {
            // On interruption, re-check runState
        }
    }
}

你会发现它是从 workQueue 队列中, 也就是等待队列中获取一个元素出来并返回!

回过头来根据代码段 6 理解下:

当前线程运行完后, 在到 workQueue 中去获取一个 task 出来, 继续运行, 这样就保证了线程池中有一定的线程一直在运行; 此时若跳出了 while 循环, 只有 workQueue 队列为空才会出现或出现了类似于 shutdown 的操作, 自然运行队列会减少 1, 当再有新的线程进来的时候, 就又开始向 worker 里面放数据了, 这样以此类推, 实现了线程池的功能.

这里可以看下 run 方法的 finally 中调用的 workerDone 方法为:

源码段 9:

void workerDone(Worker w) {
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        completedTaskCount += w.completedTasks;
        workers.remove(w);
        if (--poolSize == 0)
            tryTerminate();
    } finally {
        mainLock.unlock();
    }
}

注意这里将 workers.remove(w) 掉, 并且调用了 - poolSize 来做操作.

至于 tryTerminate 是做了更多关于回收方面的操作.

最后我们还要看一段代码就是在 [源码段 6] 中出现的代码调用为: runTask(task); 这个方法也是运行的关键.

源码段 10:

private void runTask(Runnable task) {
       final ReentrantLock runLock = this.runLock;
       runLock.lock();
       try {
           if (runState <STOP &&
               Thread.interrupted() &&
               runState>= STOP)
               thread.interrupt();
           boolean ran = false;
           beforeExecute(thread, task);
           try {
               task.run();
               ran = true;
               afterExecute(task, null);
               ++completedTasks;
           } catch (RuntimeException ex) {
               if (!ran)
                   afterExecute(task, ex);
               throw ex;
           }
       } finally {
           runLock.unlock();
       }
   }

你可以看到, 这里面的 task 为传入的 task 信息, 调用的不是 start 方法, 而是 run 方法, 因为 run 方法直接调用不会启动新的线程, 也是因为这样, 导致了你无法获取到你自己的线程的状态, 因为线程池是直接调用的 run 方法, 而不是 start 方法来运行.

这里有个 beforeExecute 和 afterExecute 方法, 分别代表在执行前和执行后, 你可以做一段操作, 在这个类中, 这两个方法都是 [空 body] 的, 因为普通线程池无需做更多的操作.

如果你要实现类似暂停等待通知的或其他的操作, 可以自己 extends 后进行重写构造;

本文没有介绍关于 ScheduledThreadPoolExecutor 调用的细节, 下一篇文章会详细说明, 因为大部分代码和本文一致, 区别在于一些细节, 在介绍: ScheduledThreadPoolExecutor 的时候, 会明确的介绍它与 Timer 和 TimerTask 的巨大区别, 区别不在于使用, 而是在于本身内在的处理细节.

来源: https://www.cnblogs.com/pony1223/p/9527710.html

与本文相关文章

暂无,快来抢沙发吧！