当前位置：

首页
/
IT
/
程序
/
JUC 源码解析

JUC 源码解析

通过上一篇 (JUC 源码分析 - 线程池篇(四):ForkJoinPool - 1) 的讲解, 相信同学们对 ForkJoinPool 已经有了一个大概的认识, 本篇我们将通过分析源码的方式来深入了解 ForkJoinPool 的具体实现原理

概述

上篇提到过, 在 java.util.concurrent 包中, Fork/Join 框架主要由 ForkJoinPoolForkJoinWorkerThread 和 ForkJoinTask(包括 RecursiveTaskRecursiveAction 和 CountedCompleter) 来实现, 它们之间的联系如下:

ForkJoinPool 中使用 ForkJoinWorkerThread 来运行 ForkJoinTask 任务, ForkJoinPool 只接收 ForkJoinTask 任务(在实际使用中, 也可以接收 Runnable/Callable 任务, 但在真正运行时, 也会把这些任务封装成 ForkJoinTask 类型的任务),RecursiveTask 是 ForkJoinTask 的子类, 是一个可以递归执行的 ForkJoinTask,RecursiveAction 是一个无返回值的 RecursiveTask,CountedCompleter 在任务完成执行后会触发执行一个自定义的钩子函数

在实际运用中, 我们一般都会继承 RecursiveTask RecursiveAction 或 CountedCompleter 来实现我们的业务需求, 而不会直接继承 ForkJoinTask 类

在本篇的解析中主要包括三个类( ForkJoinPoolForkJoinWorkerThread 和 ForkJoinTask ), 我们通过穿插讲解它们之间的联系来分析 ForkJoinPool 的运行原理

数据结构和核心参数

1. ForkJoinPool

ForkJoinPool 继承关系

内部类介绍:

ForkJoinWorkerThreadFactory: 内部线程工厂接口, 用于创建工作线程 ForkJoinWorkerThread

DefaultForkJoinWorkerThreadFactory:ForkJoinWorkerThreadFactory 的默认实现类

InnocuousForkJoinWorkerThreadFactory: 实现了 ForkJoinWorkerThreadFactory, 无许可线程工厂, 当系统变量中有系统安全管理相关属性时, 默认使用这个工厂创建工作线程

EmptyTask: 内部占位类, 用于替换队列中 join 的任务

ManagedBlocker: 为 ForkJoinPool 中的任务提供扩展管理并行数的接口, 一般用在可能会阻塞的任务(如在 Phaser 中用于等待 phase 到下一个 generation)

WorkQueue:ForkJoinPool 的核心数据结构, 本质上是 work-stealing 模式的双端任务队列, 内部存放 ForkJoinTask 对象任务, 使用 @Contented 注解修饰防止伪共享具体介绍见上篇

工作线程在运行中产生新的任务 (通常是因为调用了 fork()) 时, 此时可以把 WorkQueue 的数据结构视为一个栈, 新的任务会放入栈顶(top 位); 工作线程在处理自己工作队列的任务时, 按照 LIFO 的顺序

工作线程在处理自己的工作队列同时, 会尝试窃取一个任务(可能是来自于刚刚提交到 pool 的任务, 或是来自于其他工作线程的队列任务), 此时可以把 WorkQueue 的数据结构视为一个 FIFO 的队列, 窃取的任务位于其他线程的工作队列的队首(base 位)

伪共享状态: 缓存系统中是以缓存行 (cache line) 为单位存储的缓存行是 2 的整数幂个连续字节, 一般为 32-256 个字节最常见的缓存行大小是 64 个字节当多线程修改互相独立的变量时, 如果这些变量共享同一个缓存行, 就会无意中影响彼此的性能, 这就是伪共享

核心参数

在后面的源码解析中, 我们会看到大量的位运算, 这些位运算都是通过我们接下来介绍的一些常量参数来计算的

例如, 如果要更新活跃线程数, 使用公式

(UC_MASK & (c + AC_UNIT)) | (SP_MASK & c)

;c 代表当前 ctl,UC_MASK 和 SP_MASK 分别是高位和低位掩码, AC_UNIT 为活跃线程的增量数, 使用

(UC_MASK & (c + AC_UNIT))

就可以计算出高 32 位, 然后再加上低 32 位(SP_MASK & c), 就拼接成了一个新的 ctl

这些运算的可读性很差, 看起来有些复杂在后面源码解析中有位运算的地方我都会加上注释, 大家只需要了解它们的作用即可

ForkJoinPool 与内部类 WorkQueue 共享的一些常量:

// Constants shared across ForkJoinPool and WorkQueue
// 限定参数
static final int SMASK = 0xffff; //  低位掩码, 也是最大索引位
static final int MAX_CAP = 0x7fff; //  工作线程最大容量
static final int EVENMASK = 0xfffe; //  偶数低位掩码
static final int SQMASK = 0x007e; //  workQueues 数组最多 64 个槽位
// ctl 子域和 WorkQueue.scanState 的掩码和标志位
static final int SCANNING = 1; // 标记是否正在运行任务
static final int INACTIVE = 1 << 31; // 失活状态  负数
static final int SS_SEQ = 1 << 16; // 版本戳, 防止 ABA 问题
// ForkJoinPool.config 和 WorkQueue.config 的配置信息标记
static final int MODE_MASK = 0xffff << 16; // 模式掩码
static final int LIFO_QUEUE = 0; //LIFO 队列
static final int FIFO_QUEUE = 1 << 16; //FIFO 队列
static final int SHARED_QUEUE = 1 << 31; // 共享模式队列, 负数

ForkJoinPool 中的相关常量和实例字段:

//  低位和高位掩码
private static final long SP_MASK = 0xffffffffL;
private static final long UC_MASK = ~SP_MASK;
// 活跃线程数
private static final int AC_SHIFT = 48;
private static final long AC_UNIT = 0x0001L << AC_SHIFT; // 活跃线程数增量
private static final long AC_MASK = 0xffffL << AC_SHIFT; // 活跃线程数掩码
// 工作线程数
private static final int TC_SHIFT = 32;
private static final long TC_UNIT = 0x0001L << TC_SHIFT; // 工作线程数增量
private static final long TC_MASK = 0xffffL << TC_SHIFT; // 掩码
private static final long ADD_WORKER = 0x0001L << (TC_SHIFT + 15);  // 创建工作线程标志
// 池状态
private static final int RSLOCK = 1;
private static final int RSIGNAL = 1 << 1;
private static final int STARTED = 1 << 2;
private static final int STOP = 1 << 29;
private static final int TERMINATED = 1 << 30;
private static final int SHUTDOWN = 1 << 31;
// 实例字段
volatile long ctl;                   // 主控制参数
volatile int runState;               // 运行状态锁
final int config;                    // 并行度 | 模式
int indexSeed;                       // 用于生成工作线程索引
volatile WorkQueue[] workQueues;     // 主对象注册信息, workQueue
final ForkJoinWorkerThreadFactory factory;// 线程工厂
final UncaughtExceptionHandler ueh;  // 每个工作线程的异常信息
final String workerNamePrefix;       // 用于创建工作线程的名称
volatile AtomicLong stealCounter;    // 偷取任务总数, 也可作为同步监视器
/** 静态初始化字段 */
// 线程工厂
public static final ForkJoinWorkerThreadFactory defaultForkJoinWorkerThreadFactory;
// 启动或杀死线程的方法调用者的权限
private static final RuntimePermission modifyThreadPermission;
// 公共静态 pool
static final ForkJoinPool common;
// 并行度, 对应内部 common 池
static final int commonParallelism;
// 备用线程数, 在 tryCompensate 中使用
private static int commonMaxSpares;
// 创建 workerNamePrefix(工作线程名称前缀)时的序号
private static int poolNumberSequence;
// 线程阻塞等待新的任务的超时值(以纳秒为单位), 默认 2 秒
private static final long IDLE_TIMEOUT = 2000L * 1000L * 1000L; // 2sec
// 空闲超时时间, 防止 timer 未命中
private static final long TIMEOUT_SLOP = 20L * 1000L * 1000L;  // 20ms
// 默认备用线程数
private static final int DEFAULT_COMMON_MAX_SPARES = 256;
// 阻塞前自旋的次数, 用在在 awaitRunStateLock 和 awaitWork 中
private static final int SPINS  = 0;
//indexSeed 的增量
private static final int SEED_INCREMENT = 0x9e3779b9;

说明: ForkJoinPool 的内部状态都是通过一个 64 位的 long 型变量 ctl 来存储, 它由四个 16 位的子域组成:

AC: 正在运行工作线程数减去目标并行度, 高 16 位

TC: 总工作线程数减去目标并行度, 中高 16 位

SS: 栈顶等待线程的版本计数和状态, 中低 16 位

ID: 栈顶 WorkQueue 在池中的索引(poolIndex), 低 16 位

在后面的源码解析中, 某些地方也提取了 ctl 的低 32 位 (sp=(int)ctl) 来检查工作线程状态, 例如, 当 sp 不为 0 时说明当前还有空闲工作线程

ForkJoinPool.WorkQueue 中的相关属性:

// 初始队列容量, 2 的幂
static final int INITIAL_QUEUE_CAPACITY = 1 << 13;
// 最大队列容量
static final int MAXIMUM_QUEUE_CAPACITY = 1 << 26; // 64M
// 实例字段
volatile int scanState; // Woker 状态, <0: inactive; odd:scanning
int stackPred; // 记录前一个栈顶的 ctl
int nsteals; // 偷取任务数
int hint; // 记录偷取者索引, 初始为随机索引
int config; // 池索引和模式
volatile int qlock; // 1: locked, < 0: terminate; else 0
volatile int base; // 下一个 poll 操作的索引(栈底 / 队列头)
int top; //  下一个 push 操作的索引(栈顶 / 队列尾)
ForkJoinTask < ?>[] array; // 任务数组
final ForkJoinPool pool; // the containing pool (may be null)
final ForkJoinWorkerThread owner; // 当前工作队列的工作线程, 共享模式下为 null
volatile Thread parker; // 调用 park 阻塞期间为 owner, 其他情况为 null
volatile ForkJoinTask < ?>currentJoin; // 记录被 join 过来的任务
volatile ForkJoinTask < ?>currentSteal; // 记录从其他工作队列偷取过来的任务
2. ForkJoinTask

ForkJoinTask 继承关系

ForkJoinTask 实现了 Future 接口, 说明它也是一个可取消的异步运算任务, 实际上 ForkJoinTask 是 Future 的轻量级实现, 主要用在纯粹是计算的函数式任务或者操作完全独立的对象计算任务 fork 是主运行方法, 用于异步执行; 而 join 方法在任务结果计算完毕之后才会运行, 用来合并或返回计算结果

其内部类都比较简单, ExceptionNode 是用于存储任务执行期间的异常信息的单向链表; 其余四个类是为 Runnable/Callable 任务提供的适配器类, 用于把 Runnable/Callable 转化为 ForkJoinTask 类型的任务(因为 ForkJoinPool 只可以运行 ForkJoinTask 类型的任务)

核心参数

/** 任务运行状态 */
volatile int status; // 任务运行状态
static final int DONE_MASK   = 0xf0000000;  // 任务完成状态标志位
static final int NORMAL      = 0xf0000000;  // must be negative
static final int CANCELLED   = 0xc0000000;  // must be < NORMAL
static final int EXCEPTIONAL = 0x80000000;  // must be < CANCELLED
static final int SIGNAL      = 0x00010000;  // must be >= 1 << 16 等待信号
static final int SMASK       = 0x0000ffff;  //  低位掩码

源码解析

首先介绍一下构造函数:

public ForkJoinPool(int parallelism,
                    ForkJoinWorkerThreadFactory factory,
                    UncaughtExceptionHandler handler,
                    boolean asyncMode) {
    this(checkParallelism(parallelism),
            checkFactory(factory),
            handler,
            asyncMode ? FIFO_QUEUE : LIFO_QUEUE,
            "ForkJoinPool-" + nextPoolId() + "-worker-");
    checkPermission();
}

说明: 在 ForkJoinPool 中我们可以自定义四个参数:

parallelism: 并行度, 默认为 CPU 数, 最小为 1

factory: 工作线程工厂;

handler: 处理工作线程运行任务时的异常情况类, 默认为 null;

asyncMode: 是否为异步模式, 默认为 false 如果为 true, 表示子任务的执行遵循 FIFO 顺序并且任务不能被合并(join), 这种模式适用于工作线程只运行事件类型的异步任务

在多数场景使用时, 如果没有太强的业务需求, 我们一般直接使用 ForkJoinPool 中的 common 池, 在 JDK1.8 之后提供了

ForkJoinPool.commonPool()

方法可以直接使用 common 池, 来看一下它的构造:

private static ForkJoinPool makeCommonPool() {
    int parallelism = -1;
    ForkJoinWorkerThreadFactory factory = null;
    UncaughtExceptionHandler handler = null;
    try {  // ignore exceptions in accessing/parsing
        String pp = System.getProperty
                ("java.util.concurrent.ForkJoinPool.common.parallelism");// 并行度
        String fp = System.getProperty
                ("java.util.concurrent.ForkJoinPool.common.threadFactory");// 线程工厂
        String hp = System.getProperty
                ("java.util.concurrent.ForkJoinPool.common.exceptionHandler");// 异常处理类
        if (pp != null)
            parallelism = Integer.parseInt(pp);
        if (fp != null)
            factory = ((ForkJoinWorkerThreadFactory) ClassLoader.
                    getSystemClassLoader().loadClass(fp).newInstance());
        if (hp != null)
            handler = ((UncaughtExceptionHandler) ClassLoader.
                    getSystemClassLoader().loadClass(hp).newInstance());
    } catch (Exception ignore) {
    }
    if (factory == null) {
        if (System.getSecurityManager() == null)
            factory = defaultForkJoinWorkerThreadFactory;
        else // use security-managed default
            factory = new InnocuousForkJoinWorkerThreadFactory();
    }
    if (parallelism < 0 && // default 1 less than #cores
            (parallelism = Runtime.getRuntime().availableProcessors() - 1) <= 0)
        parallelism = 1;// 默认并行度为 1
    if (parallelism > MAX_CAP)
        parallelism = MAX_CAP;
    return new ForkJoinPool(parallelism, factory, handler, LIFO_QUEUE,
            "ForkJoinPool.commonPool-worker-");
}

使用 common pool 的优点就是我们可以通过指定系统参数的方式定义并行度线程工厂和异常处理类; 并且它使用的是同步模式, 也就是说可以支持任务合并(join)

ForkJoinPool 中的任务执行分两种:

直接通过 FJP 提交的外部任务(external/submissions task), 存放在 workQueues 的偶数槽位;

通过内部 fork 分割的子任务(Worker task), 存放在 workQueues 的奇数槽位

首先来看一下整个 Fork/Join 框架的执行流程, 后面我们的源码解析会完全按照这个流程图来进行:

ForkJoinPool 任务执行流程

在接下来的解析中, 我们会分四个部分: 首先介绍两种任务的提交流程; 再分析任务的执行过程(

ForkJoinWorkerThread.run()

到

ForkJoinTask.doExec()

这一部分); 最后介绍任务的结果获取 (ForkJoinTask.join() 和

ForkJoinTask.invoke()
)

1. 外部任务 (external/submissions task) 提交

向 ForkJoinPool 提交任务有三种方式: invoke()会等待任务计算完毕并返回计算结果; execute()是直接向池提交一个任务来异步执行, 无返回结果; submit()也是异步执行, 但是会返回提交的任务, 在适当的时候可通过 task.get()获取执行结果

这三种提交方式都都是调用 externalPush()方法来完成, 所以接下来我们将从 externalPush()方法开始逐步分析外部任务的执行过程

1.1 externalPush(ForkJoinTask<?> task)
// 添加给定任务到 submission 队列中
final void externalPush(ForkJoinTask<?> task) {
    WorkQueue[] ws;
    WorkQueue q;
    int m;
    int r = ThreadLocalRandom.getProbe();// 探针值, 用于计算 WorkQueue 槽位索引
    int rs = runState;
    if ((ws = workQueues) != null && (m = (ws.length - 1)) >= 0 &&
            (q = ws[m & r & SQMASK]) != null && r != 0 && rs > 0 && // 获取随机偶数槽位的 workQueue
            U.compareAndSwapInt(q, QLOCK, 0, 1)) {// 锁定 workQueue
        ForkJoinTask<?>[] a;
        int am, n, s;
        if ((a = q.array) != null &&
                (am = a.length - 1) > (n = (s = q.top) - q.base)) {
            int j = ((am & s) << ASHIFT) + ABASE;// 计算任务索引位置
            U.putOrderedObject(a, j, task);// 任务入列
            U.putOrderedInt(q, QTOP, s + 1);// 更新 push slot
            U.putIntVolatile(q, QLOCK, 0);// 解除锁定
            if (n <= 1)
                signalWork(ws, q);// 任务数小于 1 时尝试创建或激活一个工作线程
            return;
        }
        U.compareAndSwapInt(q, QLOCK, 1, 0);// 解除锁定
    }
    externalSubmit(task);// 初始化 workQueues 及相关属性
}

首先说明一下 externalPush 和 externalSubmit 两个方法的联系: 它们的作用都是把任务放到队列中等待执行不同的是, externalSubmit 可以说是完整版的 externalPush, 在任务首次提交时, 需要初始化 workQueues 及其他相关属性, 这个初始化操作就是 externalSubmit 来完成的; 而后再向池中提交的任务都是通过简化版的 externalSubmit-externalPush 来完成

externalPush 的执行流程很简单: 首先找到一个随机偶数槽位的 workQueue, 然后把任务放入这个 workQueue 的任务数组中, 并更新 top 位如果队列的剩余任务数小于 1, 则尝试创建或激活一个工作线程来运行任务(防止在 externalSubmit 初始化时发生异常导致工作线程创建失败)

1.2 externalSubmit(ForkJoinTask<?> task)
// 任务提交
private void externalSubmit(ForkJoinTask<?> task) {
    // 初始化调用线程的探针值, 用于计算 WorkQueue 索引
    int r;                                    // initialize caller's probe
    if ((r = ThreadLocalRandom.getProbe()) == 0) {
        ThreadLocalRandom.localInit();
        r = ThreadLocalRandom.getProbe();
    }
    for (; ; ) {
        WorkQueue[] ws;
        WorkQueue q;
        int rs, m, k;
        boolean move = false;
        if ((rs = runState) < 0) {// 池已关闭
            tryTerminate(false, false);     // help terminate
            throw new RejectedExecutionException();
        }
        // 初始化 workQueues
        else if ((rs & STARTED) == 0 ||     // initialize
                ((ws = workQueues) == null || (m = ws.length - 1) < 0)) {
            int ns = 0;
            rs = lockRunState();// 锁定 runState
            try {
                // 初始化
                if ((rs & STARTED) == 0) {
                    // 初始化 stealCounter
                    U.compareAndSwapObject(this, STEALCOUNTER, null,
                            new AtomicLong());
                    // 创建 workQueues, 容量为 2 的幂次方
                    // create workQueues array with size a power of two
                    int p = config & SMASK; // ensure at least 2 slots
                    int n = (p > 1) ? p - 1 : 1;
                    n |= n >>> 1;
                    n |= n >>> 2;
                    n |= n >>> 4;
                    n |= n >>> 8;
                    n |= n >>> 16;
                    n = (n + 1) << 1;
                    workQueues = new WorkQueue[n];
                    ns = STARTED;
                }
            } finally {
                unlockRunState(rs, (rs & ~RSLOCK) | ns);// 解锁并更新 runState
            }
        } else if ((q = ws[k = r & m & SQMASK]) != null) {// 获取随机偶数槽位的 workQueue
            if (q.qlock == 0 && U.compareAndSwapInt(q, QLOCK, 0, 1)) {// 锁定 workQueue
                ForkJoinTask<?>[] a = q.array;// 当前 workQueue 的全部任务
                int s = q.top;
                boolean submitted = false; // initial submission or resizing
                try {                      // locked version of push
                    if ((a != null && a.length > s + 1 - q.base) ||
                            (a = q.growArray()) != null) {// 扩容
                        int j = (((a.length - 1) & s) << ASHIFT) + ABASE;
                        U.putOrderedObject(a, j, task);// 放入给定任务
                        U.putOrderedInt(q, QTOP, s + 1);// 修改 push slot
                        submitted = true;
                    }
                } finally {
                    U.compareAndSwapInt(q, QLOCK, 1, 0);// 解除锁定
                }
                if (submitted) {// 任务提交成功, 创建或激活工作线程
                    signalWork(ws, q);// 创建或激活一个工作线程来运行任务
                    return;
                }
            }
            move = true;                   // move on failure 操作失败, 重新获取探针值
        } else if (((rs = runState) & RSLOCK) == 0) { // create new queue
            q = new WorkQueue(this, null);
            q.hint = r;
            q.config = k | SHARED_QUEUE;
            q.scanState = INACTIVE;
            rs = lockRunState();           // publish index
            if (rs > 0 && (ws = workQueues) != null &&
                    k < ws.length && ws[k] == null)
                ws[k] = q;                 // 更新索引 k 位值的 workQueue
            //else terminated
            unlockRunState(rs, rs & ~RSLOCK);
        } else
            move = true;                   // move if busy
        if (move)
            r = ThreadLocalRandom.advanceProbe(r);// 重新获取线程探针值
    }
}

说明: externalSubmit 是 externalPush 的完整版本, 主要用于第一次提交任务时初始化 workQueues 及相关属性, 并且提交给定任务到队列中具体执行步骤如下:

如果池为终止状态(runState<0), 调用 tryTerminate 来终止线程池, 并抛出任务拒绝异常;

如果尚未初始化, 就为 FJP 执行初始化操作: 初始化 stealCounter 创建 workerQueues, 然后继续自旋;

初始化完成后, 执行在 externalPush 中相同的操作: 获取 workQueue, 放入指定任务任务提交成功后调用 signalWork 方法创建或激活线程;

如果在步骤 3 中获取到的 workQueue 为 null, 会在这一步中创建一个 workQueue, 创建成功继续自旋执行第三步操作;

如果非上述情况, 或者有线程争用资源导致获取锁失败, 就重新获取线程探针值继续自旋

1.3 signalWork(WorkQueue[] ws, WorkQueue q)
final void signalWork(WorkQueue[] ws, WorkQueue q) {
    long c;
    int sp, i;
    WorkQueue v;
    Thread p;
    while ((c = ctl) < 0L) {                       // too few active
        if ((sp = (int) c) == 0) {                  // no idle workers
            if ((c & ADD_WORKER) != 0L)            // too few workers
                tryAddWorker(c);// 工作线程太少, 添加新的工作线程
            break;
        }
        if (ws == null)                            // unstarted/terminated
            break;
        if (ws.length <= (i = sp & SMASK))         // terminated
            break;
        if ((v = ws[i]) == null)                   // terminating
            break;
        // 计算 ctl, 加上版本戳 SS_SEQ 避免 ABA 问题
        int vs = (sp + SS_SEQ) & ~INACTIVE;        // next scanState
        int d = sp - v.scanState;                  // screen CAS
        // 计算活跃线程数 (高 32 位) 并更新为下一个栈顶的 scanState(低 32 位)
        long nc = (UC_MASK & (c + AC_UNIT)) | (SP_MASK & v.stackPred);
        if (d == 0 && U.compareAndSwapLong(this, CTL, c, nc)) {
            v.scanState = vs;                      // activate v
            if ((p = v.parker) != null)
                U.unpark(p);// 唤醒阻塞线程
            break;
        }
        if (q != null && q.base == q.top)          // no more work
            break;
    }
}

说明: 新建或唤醒一个工作线程, 在 externalPushexternalSubmitworkQueue.pushscan 中调用如果还有空闲线程, 则尝试唤醒索引到的 WorkQueue 的 parker 线程; 如果工作线程过少(

(ctl & ADD_WORKER) != 0L

), 则调用 tryAddWorker 添加一个新的工作线程

1.4 tryAddWorker(long c)
private void tryAddWorker(long c) {
    boolean add = false;
    do {
        long nc = ((AC_MASK & (c + AC_UNIT)) |
                   (TC_MASK & (c + TC_UNIT)));
        if (ctl == c) {
            int rs, stop;                 // check if terminating
            if ((stop = (rs = lockRunState()) & STOP) == 0)
                add = U.compareAndSwapLong(this, CTL, c, nc);
            unlockRunState(rs, rs & ~RSLOCK);// 释放锁
            if (stop != 0)
                break;
            if (add) {
                createWorker();// 创建工作线程
                break;
            }
        }
    } while (((c = ctl) & ADD_WORKER) != 0L && (int)c == 0);
}

说明: 尝试添加一个新的工作线程, 首先更新 ctl 中的工作线程数, 然后调用 createWorker()创建工作线程

1.5 createWorker()
private boolean createWorker() {
    ForkJoinWorkerThreadFactory fac = factory;
    Throwable ex = null;
    ForkJoinWorkerThread wt = null;
    try {
        if (fac != null && (wt = fac.newThread(this)) != null) {
            wt.start();
            return true;
        }
    } catch (Throwable rex) {
        ex = rex;
    }
    deregisterWorker(wt, ex);// 线程创建失败处理
    return false;
}

说明: createWorker 首先通过线程工厂创一个新的

ForkJoinWorkerThread

, 然后启动这个工作线程 (wt.start()) 如果期间发生异常, 调用 deregisterWorker 处理线程创建失败的逻辑(deregisterWorker 在后面再详细说明)

ForkJoinWorkerThread 的构造函数如下:

protected ForkJoinWorkerThread(ForkJoinPool pool) {
    // Use a placeholder until a useful name can be set in registerWorker
    super("aForkJoinWorkerThread");
    this.pool = pool;
    this.workQueue = pool.registerWorker(this);
}

可以看到 ForkJoinWorkerThread 在构造时首先调用父类 Thread 的方法, 然后为工作线程注册 pool 和 workQueue, 而 workQueue 的注册任务由

ForkJoinPool.registerWorker

来完成

1.6 registerWorker()
final WorkQueue registerWorker(ForkJoinWorkerThread wt) {
    UncaughtExceptionHandler handler;
    // 设置为守护线程
    wt.setDaemon(true);                           // configure thread
    if ((handler = ueh) != null)
        wt.setUncaughtExceptionHandler(handler);
    WorkQueue w = new WorkQueue(this, wt);// 构造新的 WorkQueue
    int i = 0;                                    // assign a pool index
    int mode = config & MODE_MASK;
    int rs = lockRunState();
    try {
        WorkQueue[] ws;
        int n;                    // skip if no array
        if ((ws = workQueues) != null && (n = ws.length) > 0) {
            // 生成新建 WorkQueue 的索引
            int s = indexSeed += SEED_INCREMENT;  // unlikely to collide
            int m = n - 1;
            i = ((s << 1) | 1) & m;               // Worker 任务放在奇数索引位 odd-numbered indices
            if (ws[i] != null) {                  // collision 已存在, 重新计算索引位
                int probes = 0;                   // step by approx half n
                int step = (n <= 4) ? 2 : ((n >>> 1) & EVENMASK) + 2;
                // 查找可用的索引位
                while (ws[i = (i + step) & m] != null) {
                    if (++probes >= n) {// 所有索引位都被占用, 对 workQueues 进行扩容
                        workQueues = ws = Arrays.copyOf(ws, n <<= 1);//workQueues 扩容
                        m = n - 1;
                        probes = 0;
                    }
                }
            }
            w.hint = s;                           // use as random seed
            w.config = i | mode;
            w.scanState = i;                      // publication fence
            ws[i] = w;
        }
    } finally {
        unlockRunState(rs, rs & ~RSLOCK);
    }
    wt.setName(workerNamePrefix.concat(Integer.toString(i >>> 1)));
    return w;
}

说明: registerWorker 是 ForkJoinWorkerThread 构造器的回调函数, 用于创建和记录工作线程的 WorkQueue 比较简单, 就不多赘述了注意在此为工作线程创建的 WorkQueue 是放在奇数索引的(代码行:

i = ((s << 1) | 1) & m;
)

1.7 小结

OK, 外部任务的提交流程就先讲到这里在 createWorker()中启动工作线程后(wt.start()), 当为线程分配到 CPU 执行时间片之后会运行 ForkJoinWorkerThread 的 run 方法开启线程来执行任务工作线程执行任务的流程我们在讲完内部任务提交之后会统一讲解

2. 子任务 (Worker task) 提交

子任务的提交相对比较简单, 由任务的 fork()方法完成通过上面的流程图可以看到任务被分割 (fork) 之后调用了

ForkJoinPool.WorkQueue.push()

方法直接把任务放到队列中等待被执行

2.1 ForkJoinTask.fork()
public final ForkJoinTask<V> fork() {
    Thread t;
    if ((t = Thread.currentThread()) instanceof ForkJoinWorkerThread)
        ((ForkJoinWorkerThread)t).workQueue.push(this);
    else
        ForkJoinPool.common.externalPush(this);
    return this;
}

说明: 如果当前线程是 Worker 线程, 说明当前任务是 fork 分割的子任务, 通过

ForkJoinPool.workQueue.push()

方法直接把任务放到自己的等待队列中; 否则调用

ForkJoinPool.externalPush()

提交到一个随机的等待队列中(外部任务)

2.2 ForkJoinPool.WorkQueue.push()
final void push(ForkJoinTask<?> task) {
    ForkJoinTask<?>[] a;
    ForkJoinPool p;
    int b = base, s = top, n;
    if ((a = array) != null) {    // ignore if queue removed
        int m = a.length - 1;     // fenced write for task visibility
        U.putOrderedObject(a, ((m & s) << ASHIFT) + ABASE, task);
        U.putOrderedInt(this, QTOP, s + 1);
        if ((n = s - b) <= 1) {// 首次提交, 创建或唤醒一个工作线程
            if ((p = pool) != null)
                p.signalWork(p.workQueues, this);
        } else if (n >= m)
            growArray();
    }
}

说明: 首先把任务放入等待队列并更新 top 位; 如果当前 WorkQueue 为新建的等待队列 (top-base<=1), 则调用 signalWork 方法为当前 WorkQueue 新建或唤醒一个工作线程; 如果 WorkQueue 中的任务数组容量过小, 则调用 growArray() 方法对其进行两倍扩容, growArray()方法源码如下:

final ForkJoinTask<?>[] growArray() {
    ForkJoinTask<?>[] oldA = array;// 获取内部任务列表
    int size = oldA != null ? oldA.length << 1 : INITIAL_QUEUE_CAPACITY;
    if (size > MAXIMUM_QUEUE_CAPACITY)
        throw new RejectedExecutionException("Queue capacity exceeded");
    int oldMask, t, b;
    // 新建一个两倍容量的任务数组
    ForkJoinTask<?>[] a = array = new ForkJoinTask<?>[size];
    if (oldA != null && (oldMask = oldA.length - 1) >= 0 &&
            (t = top) - (b = base) > 0) {
        int mask = size - 1;
        // 从老数组中拿出数据, 放到新的数组中
        do { // emulate poll from old array, push to new array
            ForkJoinTask<?> x;
            int oldj = ((b & oldMask) << ASHIFT) + ABASE;
            int j = ((b & mask) << ASHIFT) + ABASE;
            x = (ForkJoinTask<?>) U.getObjectVolatile(oldA, oldj);
            if (x != null &&
                    U.compareAndSwapObject(oldA, oldj, x, null))
                U.putObjectVolatile(a, j, x);
        } while (++b != t);
    }
    return a;
}

2.3 小结

到此, 两种任务的提交流程都已经解析完毕, 下一节我们来一起看看任务提交之后是如何被运行的

3. 任务执行

回到我们开始时的流程图, 在

ForkJoinPool .createWorker()

方法中创建工作线程后, 会启动工作线程, 系统为工作线程分配到 CPU 执行时间片之后会执行 ForkJoinWorkerThread 的 run()方法正式开始执行任务

3.1 ForkJoinWorkerThread.run()
public void run() {
    if (workQueue.array == null) { // only run once
        Throwable exception = null;
        try {
            onStart();// 钩子方法, 可自定义扩展
            pool.runWorker(workQueue);
        } catch (Throwable ex) {
            exception = ex;
        } finally {
            try {
                onTermination(exception);// 钩子方法, 可自定义扩展
            } catch (Throwable ex) {
                if (exception == null)
                    exception = ex;
            } finally {
                pool.deregisterWorker(this, exception);// 处理异常
            }
        }
    }
}

说明: 方法很简单, 在工作线程运行前后会调用自定义钩子函数(onStart 和 onTermination), 任务的运行则是调用了

ForkJoinPool.runWorker()

如果全部任务执行完毕或者期间遭遇异常, 则通过

ForkJoinPool.deregisterWorker

关闭工作线程并处理异常信息(deregisterWorker 方法我们后面会详细讲解)

3.2 ForkJoinPool.runWorker(WorkQueue w)
final void runWorker(WorkQueue w) {
    w.growArray();                   // allocate queue
    int seed = w.hint;               // initially holds randomization hint
    int r = (seed == 0) ? 1 : seed;  // avoid 0 for xorShift
    for (ForkJoinTask<?> t; ; ) {
        if ((t = scan(w, r)) != null)// 扫描任务执行
            w.runTask(t);
        else if (!awaitWork(w, r))
            break;
        r ^= r << 13;
        r ^= r >>> 17;
        r ^= r << 5; // xorshift
    }
}

说明: runWorker 是 ForkJoinWorkerThread 的主运行方法, 用来依次执行当前工作线程中的任务函数流程很简单: 调用 scan 方法依次获取任务, 然后调用 WorkQueue .runTask 运行任务; 如果未扫描到任务, 则调用 awaitWork 等待, 直到工作线程 / 线程池终止或等待超时

3.3 ForkJoinPool.scan(WorkQueue w, int r)
private ForkJoinTask<?> scan(WorkQueue w, int r) {
    WorkQueue[] ws;
    int m;
    if ((ws = workQueues) != null && (m = ws.length - 1) > 0 && w != null) {
        int ss = w.scanState;                     // initially non-negative
        // 初始扫描起点, 自旋扫描
        for (int origin = r & m, k = origin, oldSum = 0, checkSum = 0; ; ) {
            WorkQueue q;
            ForkJoinTask<?>[] a;
            ForkJoinTask<?> t;
            int b, n;
            long c;
            if ((q = ws[k]) != null) {// 获取 workQueue
                if ((n = (b = q.base) - q.top) < 0 &&
                        (a = q.array) != null) {      // non-empty
                    // 计算偏移量
                    long i = (((a.length - 1) & b) << ASHIFT) + ABASE;
                    if ((t = ((ForkJoinTask<?>)
                            U.getObjectVolatile(a, i))) != null && // 取 base 位置任务
                            q.base == b) {//stable
                        if (ss >= 0) {  //scanning
                            if (U.compareAndSwapObject(a, i, t, null)) {//
                                q.base = b + 1;// 更新 base 位
                                if (n < -1)       // signal others
                                    signalWork(ws, q);// 创建或唤醒工作线程来运行任务
                                return t;
                            }
                        } else if (oldSum == 0 &&   // try to activate 尝试激活工作线程
                                w.scanState < 0)
                            tryRelease(c = ctl, ws[m & (int) c], AC_UNIT);// 唤醒栈顶工作线程
                    }
                    //base 位置任务为空或 base 位置偏移, 随机移位重新扫描
                    if (ss < 0)                   // refresh
                        ss = w.scanState;
                    r ^= r << 1;
                    r ^= r >>> 3;
                    r ^= r << 10;
                    origin = k = r & m;           // move and rescan
                    oldSum = checkSum = 0;
                    continue;
                }
                checkSum += b;// 队列任务为空, 记录 base 位
            }
            // 更新索引 k 继续向后查找
            if ((k = (k + 1) & m) == origin) {    // continue until stable
                // 运行到这里说明已经扫描了全部的 workQueues, 但并未扫描到任务
                if ((ss >= 0 || (ss == (ss = w.scanState))) &&
                        oldSum == (oldSum = checkSum)) {
                    if (ss < 0 || w.qlock < 0)    // already inactive
                        break;// 已经被灭活或终止, 跳出循环
                    // 对当前 WorkQueue 进行灭活操作
                    int ns = ss | INACTIVE;       // try to inactivate
                    long nc = ((SP_MASK & ns) |
                            (UC_MASK & ((c = ctl) - AC_UNIT)));// 计算 ctl 为 INACTIVE 状态并减少活跃线程数
                    w.stackPred = (int) c;         // hold prev stack top
                    U.putInt(w, QSCANSTATE, ns);// 修改 scanState 为 inactive 状态
                    if (U.compareAndSwapLong(this, CTL, c, nc))// 更新 scanState 为灭活状态
                        ss = ns;
                    else
                        w.scanState = ss;         // back out
                }
                checkSum = 0;// 重置 checkSum, 继续循环
            }
        }
    }
    return null;
}

说明: 扫描并尝试偷取一个任务使用 w.hint 进行随机索引 WorkQueue, 也就是说并不一定会执行当前 WorkQueue 中的任务, 而是偷取别的 Worker 的任务来执行

函数的大概执行流程如下:

取随机位置的一个 WorkQueue;

获取 base 位的 ForkJoinTask, 成功取到后更新 base 位并返回任务; 如果取到的 WorkQueue 中任务数大于 1, 则调用 signalWork 创建或唤醒其他工作线程;

如果当前工作线程处于不活跃状态(INACTIVE), 则调用 tryRelease 尝试唤醒栈顶工作线程来执行 tryRelease 源码如下:

private boolean tryRelease(long c, WorkQueue v, long inc) {
    int sp = (int) c, vs = (sp + SS_SEQ) & ~INACTIVE;
    Thread p;
    //ctl 低 32 位等于 scanState, 说明可以唤醒 parker 线程
    if (v != null && v.scanState == sp) {          // v is at top of stack
        // 计算活跃线程数 (高 32 位) 并更新为下一个栈顶的 scanState(低 32 位)
        long nc = (UC_MASK & (c + inc)) | (SP_MASK & v.stackPred);
        if (U.compareAndSwapLong(this, CTL, c, nc)) {
            v.scanState = vs;
            if ((p = v.parker) != null)
                U.unpark(p);// 唤醒线程
            return true;
        }
    }
    return false;
}

如果 base 位任务为空或发生偏移, 则对索引位进行随机移位, 然后重新扫描;

如果扫描整个 workQueues 之后没有获取到任务, 则设置当前工作线程为 INACTIVE 状态; 然后重置 checkSum, 再次扫描一圈之后如果还没有任务则跳出循环返回 null

3.4 ForkJoinPool.awaitWork(WorkQueue w, int r)
private boolean awaitWork(WorkQueue w, int r) {
    if (w == null || w.qlock < 0)                 // w is terminating
        return false;
    for (int pred = w.stackPred, spins = SPINS, ss; ; ) {
        if ((ss = w.scanState) >= 0)// 正在扫描, 跳出循环
            break;
        else if (spins > 0) {
            r ^= r << 6;
            r ^= r >>> 21;
            r ^= r << 7;
            if (r >= 0 && --spins == 0) {         // randomize spins
                WorkQueue v;
                WorkQueue[] ws;
                int s, j;
                AtomicLong sc;
                if (pred != 0 && (ws = workQueues) != null &&
                        (j = pred & SMASK) < ws.length &&
                        (v = ws[j]) != null &&        // see if pred parking
                        (v.parker == null || v.scanState >= 0))
                    spins = SPINS;                // continue spinning
            }
        } else if (w.qlock < 0)                     // 当前 workQueue 已经终止, 返回 false recheck after spins
            return false;
        else if (!Thread.interrupted()) {// 判断线程是否被中断, 并清除中断状态
            long c, prevctl, parkTime, deadline;
            int ac = (int) ((c = ctl) >> AC_SHIFT) + (config & SMASK);// 活跃线程数
            if ((ac <= 0 && tryTerminate(false, false)) || // 无 active 线程, 尝试终止
                    (runState & STOP) != 0)           // pool terminating
                return false;
            if (ac <= 0 && ss == (int) c) {        // is last waiter
                // 计算活跃线程数 (高 32 位) 并更新为下一个栈顶的 scanState(低 32 位)
                prevctl = (UC_MASK & (c + AC_UNIT)) | (SP_MASK & pred);
                int t = (short) (c >>> TC_SHIFT);  // shrink excess spares
                if (t > 2 && U.compareAndSwapLong(this, CTL, c, prevctl))// 总线程过量
                    return false;                 // else use timed wait
                // 计算空闲超时时间
                parkTime = IDLE_TIMEOUT * ((t >= 0) ? 1 : 1 - t);
                deadline = System.nanoTime() + parkTime - TIMEOUT_SLOP;
            } else
                prevctl = parkTime = deadline = 0L;
            Thread wt = Thread.currentThread();
            U.putObject(wt, PARKBLOCKER, this);   // emulate LockSupport
            w.parker = wt;// 设置 parker, 准备阻塞
            if (w.scanState < 0 && ctl == c)      // recheck before park
                U.park(false, parkTime);// 阻塞指定的时间
            U.putOrderedObject(w, QPARKER, null);
            U.putObject(wt, PARKBLOCKER, null);
            if (w.scanState >= 0)// 正在扫描, 说明等到任务, 跳出循环
                break;
            if (parkTime != 0L && ctl == c &&
                    deadline - System.nanoTime() <= 0L &&
                    U.compareAndSwapLong(this, CTL, c, prevctl))// 未等到任务, 更新 ctl, 返回 false
                return false;                     // shrink pool
        }
    }
    return true;
}

说明: 回到 runWorker 方法, 如果 scan 方法未扫描到任务, 会调用 awaitWork 等待获取任务函数的具体执行流程大家看源码, 这里简单说一下:

在等待获取任务期间, 如果工作线程或线程池已经终止则直接返回 false 如果当前无 active 线程, 尝试终止线程池并返回 false, 如果终止失败并且当前是最后一个等待的 Worker, 就阻塞指定的时间 (IDLE_TIMEOUT); 等到届期或被唤醒后如果发现自己是 scanning(scanState >= 0) 状态, 说明已经等到任务, 跳出等待返回 true 继续 scan, 否则的更新 ctl 并返回 false

3.5 WorkQueue.runTask()
final void runTask(ForkJoinTask<?> task) {
    if (task != null) {
        scanState &= ~SCANNING; // mark as busy
        (currentSteal = task).doExec();// 更新 currentSteal 并执行任务
        U.putOrderedObject(this, QCURRENTSTEAL, null); // release for GC
        execLocalTasks();// 依次执行本地任务
        ForkJoinWorkerThread thread = owner;
        if (++nsteals < 0)      // collect on overflow
            transferStealCount(pool);// 增加偷取任务数
        scanState |= SCANNING;
        if (thread != null)
            thread.afterTopLevelExec();// 执行钩子函数
    }
}

说明: 在 scan 方法扫描到任务之后, 调用 WorkQueue.runTask()来执行获取到的任务, 大概流程如下:

标记 scanState 为正在执行状态;

更新 currentSteal 为当前获取到的任务并执行它, 任务的执行调用了

ForkJoinTask.doExec()

方法, 源码如下:

//ForkJoinTask.doExec()
final int doExec() {
    int s; boolean completed;
    if ((s = status) >= 0) {
        try {
            completed = exec();// 执行我们定义的任务
        } catch (Throwable rex) {
            return setExceptionalCompletion(rex);
        }
        if (completed)
            s = setCompletion(NORMAL);
    }
    return s;
}

调用 execLocalTasks 依次执行当前 WorkerQueue 中的任务, 源码如下:

// 执行并移除所有本地任务
final void execLocalTasks() {
    int b = base, m, s;
    ForkJoinTask<?>[] a = array;
    if (b - (s = top - 1) <= 0 && a != null &&
            (m = a.length - 1) >= 0) {
        if ((config & FIFO_QUEUE) == 0) {//FIFO 模式
            for (ForkJoinTask<?> t; ; ) {
                if ((t = (ForkJoinTask<?>) U.getAndSetObject
                        (a, ((m & s) << ASHIFT) + ABASE, null)) == null)//FIFO 执行, 取 top 任务
                    break;
                U.putOrderedInt(this, QTOP, s);
                t.doExec();// 执行
                if (base - (s = top - 1) > 0)
                    break;
            }
        } else
            pollAndExecAll();//LIFO 模式执行, 取 base 任务
    }
}

更新偷取任务数;

还原 scanState 并执行钩子函数

3.6 ForkJoinPool.deregisterWorker(ForkJoinWorkerThread wt, Throwable ex)
final void deregisterWorker(ForkJoinWorkerThread wt, Throwable ex) {
    WorkQueue w = null;
    //1. 移除 workQueue
    if (wt != null && (w = wt.workQueue) != null) {// 获取 ForkJoinWorkerThread 的等待队列
        WorkQueue[] ws;                           // remove index from array
        int idx = w.config & SMASK;// 计算 workQueue 索引
        int rs = lockRunState();// 获取 runState 锁和当前池运行状态
        if ((ws = workQueues) != null && ws.length > idx && ws[idx] == w)
            ws[idx] = null;// 移除 workQueue
        unlockRunState(rs, rs & ~RSLOCK);// 解除 runState 锁
    }
    //2. 减少 CTL 数
    long c;                                       // decrement counts
    do {} while (!U.compareAndSwapLong
                 (this, CTL, c = ctl, ((AC_MASK & (c - AC_UNIT)) |
                                       (TC_MASK & (c - TC_UNIT)) |
                                       (SP_MASK & c))));
    //3. 处理被移除 workQueue 内部相关参数
    if (w != null) {
        w.qlock = -1;                             // ensure set
        w.transferStealCount(this);
        w.cancelAll();                            // cancel remaining tasks
    }
    //4. 如果线程未终止, 替换被移除的 workQueue 并唤醒内部线程
    for (;;) {                                    // possibly replace
        WorkQueue[] ws; int m, sp;
        // 尝试终止线程池
        if (tryTerminate(false, false) || w == null || w.array == null ||
            (runState & STOP) != 0 || (ws = workQueues) == null ||
            (m = ws.length - 1) < 0)              // already terminating
            break;
        // 唤醒被替换的线程, 依赖于下一步
        if ((sp = (int)(c = ctl)) != 0) {         // wake up replacement
            if (tryRelease(c, ws[sp & m], AC_UNIT))
                break;
        }
        // 创建工作线程替换
        else if (ex != null && (c & ADD_WORKER) != 0L) {
            tryAddWorker(c);                      // create replacement
            break;
        }
        else                                      // don't need replacement
            break;
    }
    //5. 处理异常
    if (ex == null)                               // help clean on way out
        ForkJoinTask.helpExpungeStaleExceptions();
    else                                          // rethrow
        ForkJoinTask.rethrow(ex);
}

说明: deregisterWorker 方法用于工作线程运行完毕之后终止线程或处理工作线程异常, 主要就是清除已关闭的工作线程或回滚创建线程之前的操作, 并把传入的异常抛给 ForkJoinTask 来处理具体步骤见源码注释

3.7 小结

本节我们对任务的执行流程进行了说明, 后面我们将继续介绍任务的结果获取(join/invoke)

4. 获取任务结果 - ForkJoinTask.join() / ForkJoinTask.invoke()

join() :
// 合并任务结果
public final V join() {
    int s;
    if ((s = doJoin() & DONE_MASK) != NORMAL)
        reportException(s);
    return getRawResult();
}
//join, get, quietlyJoin 的主实现方法
private int doJoin() {
    int s; Thread t; ForkJoinWorkerThread wt; ForkJoinPool.WorkQueue w;
    return (s = status) < 0 ? s :
        ((t = Thread.currentThread()) instanceof ForkJoinWorkerThread) ?
        (w = (wt = (ForkJoinWorkerThread)t).workQueue).
        tryUnpush(this) && (s = doExec()) < 0 ? s :
        wt.pool.awaitJoin(w, this, 0L) :
        externalAwaitDone();
}
invoke() :
// 执行任务, 并等待任务完成并返回结果
public final V invoke() {
    int s;
    if ((s = doInvoke() & DONE_MASK) != NORMAL)
        reportException(s);
    return getRawResult();
}
//invoke, quietlyInvoke 的主实现方法
private int doInvoke() {
    int s; Thread t; ForkJoinWorkerThread wt;
    return (s = doExec()) < 0 ? s :
        ((t = Thread.currentThread()) instanceof ForkJoinWorkerThread) ?
        (wt = (ForkJoinWorkerThread)t).pool.
        awaitJoin(wt.workQueue, this, 0L) :
        externalAwaitDone();
}

说明: join()方法一把是在任务 fork()之后调用, 用来获取 (或者叫合并) 任务的执行结果

ForkJoinTask 的 join()和 invoke()方法都可以用来获取任务的执行结果 (另外还有 get 方法也是调用了 doJoin 来获取任务结果, 但是会响应运行时异常), 它们对外部提交任务的执行方式一致, 都是通过 externalAwaitDone 方法等待执行结果不同的是 invoke() 方法会直接执行当前任务; 而 join()方法则是在当前任务在队列 top 位时 (通过 tryUnpush 方法判断) 才能执行, 如果当前任务不在 top 位或者任务执行失败调用

ForkJoinPool.awaitJoin

方法帮助执行或阻塞当前 join 任务(所以在官方文档中建议了我们对 ForkJoinTask 任务的调用顺序, 一对 fork-join 操作一般按照如下顺序调用:

a.fork(); b.fork(); b.join(); a.join();

因为任务 b 是后面进入队列, 也就是说它是在栈顶的 (top 位), 在它 fork() 之后直接调用 join()就可以直接执行而不会调用

ForkJoinPool.awaitJoin

方法去等待)

在这些方法中, join()相对比较全面, 所以之后的讲解我们将从 join()开始逐步向下分析, 首先看一下 join()的执行流程:

join 执行流程

后面的源码分析中, 我们首先讲解比较简单的外部 join 任务(externalAwaitDone), 然后再讲解内部 join 任务(从

ForkJoinPool.awaitJoin()

开始)

4.1 ForkJoinTask.externalAwaitDone()
private int externalAwaitDone() {
    // 执行任务
    int s = ((this instanceof CountedCompleter) ? // try helping
             ForkJoinPool.common.externalHelpComplete(  // CountedCompleter 任务
                 (CountedCompleter<?>)this, 0) :
             ForkJoinPool.common.tryExternalUnpush(this) ? doExec() : 0);  // ForkJoinTask 任务
    if (s >= 0 && (s = status) >= 0) {// 执行失败, 进入等待
        boolean interrupted = false;
        do {
            if (U.compareAndSwapInt(this, STATUS, s, s | SIGNAL)) {  // 更新 state
                synchronized (this) {
                    if (status >= 0) {//SIGNAL 等待信号
                        try {
                            wait(0L);
                        } catch (InterruptedException ie) {
                            interrupted = true;
                        }
                    }
                    else
                        notifyAll();
                }
            }
        } while ((s = status) >= 0);
        if (interrupted)
            Thread.currentThread().interrupt();
    }
    return s;
}

说明: 如果当前 join 为外部调用, 则调用此方法执行任务, 如果任务执行失败就进入等待方法本身是很简单的, 需要注意的是对不同的任务类型分两种情况:

如果我们的任务为 CountedCompleter 类型的任务, 则调用

externalHelpComplete

方法来执行任务(由于 CountedCompleter 相对比较复杂, 所以 CountedCompleter 任务的执行流程在此篇就不详细介绍了, 后面笔者会开新篇来专门讲解 CountedCompleter, 有兴趣的同学们可以自己先看一下)

其他类型的 ForkJoinTask 任务调用 tryExternalUnpush 来执行, 源码如下:

// 为外部提交者提供 tryUnpush 功能(给定任务在 top 位时弹出任务)
final boolean tryExternalUnpush(ForkJoinTask<?> task) {
    WorkQueue[] ws;
    WorkQueue w;
    ForkJoinTask<?>[] a;
    int m, s;
    int r = ThreadLocalRandom.getProbe();
    if ((ws = workQueues) != null && (m = ws.length - 1) >= 0 &&
            (w = ws[m & r & SQMASK]) != null &&
            (a = w.array) != null && (s = w.top) != w.base) {
        long j = (((a.length - 1) & (s - 1)) << ASHIFT) + ABASE;  // 取 top 位任务
        if (U.compareAndSwapInt(w, QLOCK, 0, 1)) {  // 加锁
            if (w.top == s && w.array == a &&
                    U.getObject(a, j) == task &&
                    U.compareAndSwapObject(a, j, task, null)) {  // 符合条件, 弹出
                U.putOrderedInt(w, QTOP, s - 1);  // 更新 top
                U.putOrderedInt(w, QLOCK, 0); // 解锁, 返回 true
                return true;
            }
            U.compareAndSwapInt(w, QLOCK, 1, 0);  // 当前任务不在 top 位, 解锁返回 false
        }
    }
    return false;
}

tryExternalUnpush 的作用就是判断当前任务是否在 top 位, 如果是则弹出任务, 然后在 externalAwaitDone 中调用 doExec()执行任务

4.2 ForkJoinPool.awaitJoin()
final int awaitJoin(WorkQueue w, ForkJoinTask<?> task, long deadline) {
    int s = 0;
    if (task != null && w != null) {
        ForkJoinTask<?> prevJoin = w.currentJoin;  // 获取给定 Worker 的 join 任务
        U.putOrderedObject(w, QCURRENTJOIN, task);  // 把 currentJoin 替换为给定任务
        // 判断是否为 CountedCompleter 类型的任务
        CountedCompleter<?> cc = (task instanceof CountedCompleter) ?
                (CountedCompleter<?>) task : null;
        for (; ; ) {
            if ((s = task.status) < 0)  // 已经完成 | 取消 | 异常 跳出循环
                break;
            if (cc != null)//CountedCompleter 任务由 helpComplete 来完成 join
                helpComplete(w, cc, 0);
            else if (w.base == w.top || w.tryRemoveAndExec(task))  // 尝试执行
                helpStealer(w, task);  // 队列为空或执行失败, 任务可能被偷, 帮助偷取者执行该任务
            if ((s = task.status) < 0) // 已经完成 | 取消 | 异常, 跳出循环
                break;
            // 计算任务等待时间
            long ms, ns;
            if (deadline == 0L)
                ms = 0L;
            else if ((ns = deadline - System.nanoTime()) <= 0L)
                break;
            else if ((ms = TimeUnit.NANOSECONDS.toMillis(ns)) <= 0L)
                ms = 1L;
            if (tryCompensate(w)) {// 执行补偿操作
                task.internalWait(ms);// 补偿执行成功, 任务等待指定时间
                U.getAndAddLong(this, CTL, AC_UNIT);// 更新活跃线程数
            }
        }
        U.putOrderedObject(w, QCURRENTJOIN, prevJoin);// 循环结束, 替换为原来的 join 任务
    }
    return s;
}

说明: 如果当前 join 任务不在 Worker 等待队列的 top 位, 或者任务执行失败, 调用此方法来帮助执行或阻塞当前 join 的任务函数执行流程如下:

由于每次调用 awaitJoin 都会优先执行当前 join 的任务, 所以首先会更新 currentJoin 为当前 join 任务;

进入自旋:

首先检查任务是否已经完成(通过 task.status < 0 判断), 如果给定任务执行完毕 | 取消 | 异常则跳出循环返回执行状态 s;

如果是 CountedCompleter 任务类型, 调用 helpComplete 方法来完成 join 操作(这一步我们会在后面开一篇来专门讲解 CountedCompleter, 本篇暂时不做解析);

非 CountedCompleter 任务类型调用

WorkQueue.tryRemoveAndExec

尝试执行任务;

如果给定 WorkQueue 的等待队列为空或任务执行失败, 说明任务可能被偷, 调用 helpStealer 帮助偷取者执行任务(也就是说, 偷取者帮我执行任务, 我去帮偷取者执行它的任务);

再次判断任务是否执行完毕(task.status < 0), 如果任务执行失败, 计算一个等待时间准备进行补偿操作;

调用 tryCompensate 方法为给定 WorkQueue 尝试执行补偿操作在执行补偿期间, 如果发现资源争用 | 池处于 unstable 状态 | 当前 Worker 已终止, 则调用

ForkJoinTask.internalWait()

方法等待指定的时间, 任务唤醒之后继续自旋,

ForkJoinTask.internalWait()

源码如下:

final void internalWait(long timeout) {
    int s;
    if ((s = status) >= 0 && // force completer to issue notify
        U.compareAndSwapInt(this, STATUS, s, s | SIGNAL)) {// 更新任务状态为 SIGNAL(等待唤醒)
        synchronized (this) {
            if (status >= 0)
                try { wait(timeout); } catch (InterruptedException ie) { }
            else
                notifyAll();
        }
    }
}

在 awaitJoin 中, 我们总共调用了三个比较复杂的方法:

tryRemoveAndExechelpStealer 和 tryCompensate

, 下面我们依次讲解

4.2.1 WorkQueue.tryRemoveAndExec(ForkJoinTask<?> task)
final boolean tryRemoveAndExec(ForkJoinTask<?> task) {
    ForkJoinTask<?>[] a;
    int m, s, b, n;
    if ((a = array) != null && (m = a.length - 1) >= 0 &&
            task != null) {
        while ((n = (s = top) - (b = base)) > 0) {
            // 从 top 往下自旋查找
            for (ForkJoinTask<?> t; ; ) {      // traverse from s to b
                long j = ((--s & m) << ASHIFT) + ABASE;// 计算任务索引
                if ((t = (ForkJoinTask<?>) U.getObject(a, j)) == null) // 获取索引到的任务
                    return s + 1 == top;     // shorter than expected
                else if (t == task) { // 给定任务为索引任务
                    boolean removed = false;
                    if (s + 1 == top) {      // pop
                        if (U.compareAndSwapObject(a, j, task, null)) { // 弹出任务
                            U.putOrderedInt(this, QTOP, s); // 更新 top
                            removed = true;
                        }
                    } else if (base == b)      // replace with proxy
                        removed = U.compareAndSwapObject(
                                a, j, task, new EmptyTask()); //join 任务已经被移除, 替换为一个占位任务
                    if (removed)
                        task.doExec(); // 执行
                    break;
                } else if (t.status < 0 && s + 1 == top) { // 给定任务不是 top 任务
                    if (U.compareAndSwapObject(a, j, t, null)) // 弹出任务
                        U.putOrderedInt(this, QTOP, s);// 更新 top
                    break;                  // was cancelled
                }
                if (--n == 0) // 遍历结束
                    return false;
            }
            if (task.status < 0) // 任务执行完毕
                return false;
        }
    }
    return true;
}

说明: 从 top 位开始自旋向下找到给定任务, 如果找到把它从当前 Worker 的任务队列中移除并执行它注意返回的参数: 如果任务队列为空或者任务未执行完毕返回 true; 任务执行完毕返回 false

4.2.2 ForkJoinPool.helpStealer(WorkQueue w, ForkJoinTask<?> task)
private void helpStealer(WorkQueue w, ForkJoinTask<?> task) {
    WorkQueue[] ws = workQueues;
    int oldSum = 0, checkSum, m;
    if (ws != null && (m = ws.length - 1) >= 0 && w != null &&
            task != null) {
        do {                                       // restart point
            checkSum = 0;                          // for stability check
            ForkJoinTask<?> subtask;
            WorkQueue j = w, v;                    // v is subtask stealer
            descent:
            for (subtask = task; subtask.status >= 0; ) {
                //1. 找到给定 WorkQueue 的偷取者 v
                for (int h = j.hint | 1, k = 0, i; ; k += 2) {// 跳两个索引, 因为 Worker 在奇数索引位
                    if (k > m)                     // can't find stealer
                        break descent;
                    if ((v = ws[i = (h + k) & m]) != null) {
                        if (v.currentSteal == subtask) {// 定位到偷取者
                            j.hint = i;// 更新 stealer 索引
                            break;
                        }
                        checkSum += v.base;
                    }
                }
                //2. 帮助偷取者 v 执行任务
                for (; ; ) {                         // help v or descend
                    ForkJoinTask<?>[] a;            // 偷取者内部的任务
                    int b;
                    checkSum += (b = v.base);
                    ForkJoinTask<?> next = v.currentJoin;// 获取偷取者的 join 任务
                    if (subtask.status < 0 || j.currentJoin != subtask ||
                            v.currentSteal != subtask) // stale
                        break descent; // stale, 跳出 descent 循环重来
                    if (b - v.top >= 0 || (a = v.array) == null) {
                        if ((subtask = next) == null)   // 偷取者的 join 任务为 null, 跳出 descent 循环
                            break descent;
                        j = v;
                        break; // 偷取者内部任务为空, 可能任务也被偷走了; 跳出本次循环, 查找偷取者的偷取者
                    }
                    int i = (((a.length - 1) & b) << ASHIFT) + ABASE;// 获取 base 偏移地址
                    ForkJoinTask<?> t = ((ForkJoinTask<?>)
                            U.getObjectVolatile(a, i));// 获取偷取者的 base 任务
                    if (v.base == b) {
                        if (t == null)             // stale
                            break descent; // stale, 跳出 descent 循环重来
                        if (U.compareAndSwapObject(a, i, t, null)) {// 弹出任务
                            v.base = b + 1;         // 更新偷取者的 base 位
                            ForkJoinTask<?> ps = w.currentSteal;// 获取调用者偷来的任务
                            int top = w.top;
                            // 首先更新给定 workQueue 的 currentSteal 为偷取者的 base 任务, 然后执行该任务
                            // 然后通过检查 top 来判断给定 workQueue 是否有自己的任务, 如果有,
                            // 则依次弹出任务 (LIFO)-> 更新 currentSteal->执行该任务(注意这里是自己偷自己的任务执行)
                            do {
                                U.putOrderedObject(w, QCURRENTSTEAL, t);
                                t.doExec();        // clear local tasks too
                            } while (task.status >= 0 &&
                                    w.top != top && // 内部有自己的任务, 依次弹出执行
                                    (t = w.pop()) != null);
                            U.putOrderedObject(w, QCURRENTSTEAL, ps);// 还原给定 workQueue 的 currentSteal
                            if (w.base != w.top)// 给定 workQueue 有自己的任务了, 帮助结束, 返回
                                return;            // can't further help
                        }
                    }
                }
            }
        } while (task.status >= 0 && oldSum != (oldSum = checkSum));
    }
}

说明: 如果队列为空或任务执行失败, 说明任务可能被偷, 调用此方法来帮助偷取者执行任务基本思想是: 偷取者帮助我执行任务, 我去帮助偷取者执行它的任务

函数执行流程如下:

循环定位偷取者, 由于 Worker 是在奇数索引位, 所以每次会跳两个索引位定位到偷取者之后, 更新调用者 WorkQueue 的 hint 为偷取者的索引, 方便下次定位;

定位到偷取者后, 开始帮助偷取者执行任务从偷取者的 base 索引开始, 每次偷取一个任务执行在帮助偷取者执行任务后, 如果调用者发现本身已经有任务 (w.top != top), 则依次弹出自己的任务(LIFO 顺序) 并执行(也就是说自己偷自己的任务执行)

4.2.3 ForkJoinPool.tryCompensate(WorkQueue w)
// 执行补偿操作: 尝试缩减活动线程量, 可能释放或创建一个补偿线程来准备阻塞
private boolean tryCompensate(WorkQueue w) {
    boolean canBlock;
    WorkQueue[] ws;
    long c;
    int m, pc, sp;
    if (w == null || w.qlock < 0 ||           // caller terminating
            (ws = workQueues) == null || (m = ws.length - 1) <= 0 ||
            (pc = config & SMASK) == 0)           // parallelism disabled
        canBlock = false; // 调用者已终止
    else if ((sp = (int) (c = ctl)) != 0)      // release idle worker
        canBlock = tryRelease(c, ws[sp & m], 0L);// 唤醒等待的工作线程
    else {// 没有空闲线程
        int ac = (int) (c >> AC_SHIFT) + pc; // 活跃线程数
        int tc = (short) (c >> TC_SHIFT) + pc;// 总线程数
        int nbusy = 0;                        // validate saturation
        for (int i = 0; i <= m; ++i) {        // two passes of odd indices
            WorkQueue v;
            if ((v = ws[((i << 1) | 1) & m]) != null) {// 取奇数索引位
                if ((v.scanState & SCANNING) != 0)// 没有正在运行任务, 跳出
                    break;
                ++nbusy;// 正在运行任务, 添加标记
            }
        }
        if (nbusy != (tc << 1) || ctl != c)
            canBlock = false;                 // unstable or stale
        else if (tc >= pc && ac > 1 && w.isEmpty()) {// 总线程数大于并行度 && 活动线程数大于 1 && 调用者任务队列为空, 不需要补偿
            long nc = ((AC_MASK & (c - AC_UNIT)) |
                    (~AC_MASK & c));       // uncompensated
            canBlock = U.compareAndSwapLong(this, CTL, c, nc);// 更新活跃线程数
        } else if (tc >= MAX_CAP ||
                (this == common && tc >= pc + commonMaxSpares))// 超出最大线程数
            throw new RejectedExecutionException(
                    "Thread limit exceeded replacing blocked worker");
        else {                                // similar to tryAddWorker
            boolean add = false;
            int rs;      // CAS within lock
            long nc = ((AC_MASK & c) |
                    (TC_MASK & (c + TC_UNIT)));// 计算总线程数
            if (((rs = lockRunState()) & STOP) == 0)
                add = U.compareAndSwapLong(this, CTL, c, nc);// 更新总线程数
            unlockRunState(rs, rs & ~RSLOCK);
            // 运行到这里说明活跃工作线程数不足, 需要创建一个新的工作线程来补偿
            canBlock = add && createWorker(); // throws on exception
        }
    }
    return canBlock;
}

说明: 具体的执行看源码及注释, 这里我们简单总结一下需要和不需要补偿的几种情况:

需要补偿:

调用者队列不为空, 并且有空闲工作线程, 这种情况会唤醒空闲线程(调用 tryRelease 方法)

池尚未停止, 活跃线程数不足, 这时会新建一个工作线程(调用 createWorker 方法)

不需要补偿:

调用者已终止或池处于不稳定状态

总线程数大于并行度 && 活动线程数大于 1 && 调用者任务队列为空

总结

ForkJoinPool 内部的代码实现很复杂, 如果只是为了应付面试, 同学们只需要理解它的内部思想即可

本章重点:

Fork/Join 任务运行机制

ForkJoinPool 的 work-stealing 实现方式

来源: http://www.jianshu.com/p/6a14d0b54b8d

与本文相关文章

暂无,快来抢沙发吧！