Volatile 可以看做是轻量级的 Synchronized, 它只保证了共享变量的可见性. 在线程 A 修改被 volatile 修饰的共享变量之后, 线程 B 能够读取到正确的值. java 在多线程中操作共享变量的过程中, 会存在指令重排序与共享变量工作内存缓存的问题.
java 内存模型
Java 内存模型规定了所有的变量都存储在主内存中. 每条线程中还有自己的工作内存, 线程的工作内存中保存了被该线程所使用到的变量 (这些变量是从主内存中拷贝而来). 线程对变量的所有操作(读取, 赋值) 都必须在工作内存中进行. 不同线程之间也无法直接访问对方工作内存中的变量, 线程间变量值的传递均需要通过主内存来完成.
并发编程的三大概念
可见性
可见性是一种复杂的属性, 因为可见性中的错误总是会违背我们的直觉. 通常, 我们无法确保执行读操作的线程能适时看到其他线程写入的值, 有时甚至是根本不可能的事情. 为了确保多个线程之间对内存写入操作的可见性, 必须使用同步机制.
可见性, 是指线程之间的可见性, 一个线程修改的状态对另一个线程是可见的. 也就是线程修改的结果.
另一个线程马上就能看到. 比如: 用 volattitle 修饰的变量, 就会具有可见性. volatile 修饰的变量不允许线程内部缓存和重排序, 即直接修改内存. 所以对其他线程是可见的. 但是这里需要注意一个问题, volatile 只能让他修饰内容具有可见性, 但不能保证他具有原子性. 比如 volatile int a = 0; 之后有一个操作 a++; 这个变量 a 具有可见性, 但是 a++ 依然是一个非原子操作, 也就是这个操作同样存在线程安全问题.
而普通的共享变量不能保证可见性, 因为普通共享变量被修改之后, 什么时候被写入主存是不确定的, 当其他线程去读取时, 此时内存中可能还是原来的旧值, 因此无法保证可见性.
在 Java 中通过 synchronized 和 Lock 也能够保证可见性, synchronized 和 Lock 能保证同一时刻只有一个线程获取锁然后执行同步代码, 并且在释放锁之前会将对变量的修改刷新到主存当中. 因此可以保证可见性.
原子性
原子是世界上的最小单位, 具有不可分割性. 原子性: 即一个操作或者多个操作 要么全部执行并且执行的过程不会被任何因素打断, 要么就都不执行. 在 Java 中, 对基本数据类型的变量的读取和赋值操作是原子性操作, 即这些操作是不可被中断的, 要么执行, 要么不执行.
比如 a=0;(a 非 long 和 double 类型) 这个操作是不可分割的, 那么我们说这个操作时原子操作. 再比如: a++; 这个操作实际是 a = a + 1; 是可分割的, 所以他不是一个原子操作. 非原子操作都会存在线程安全问题, 需要我们使用同步技术 (sychronized) 来让它变成一个原子操作. 一个操作是原子操作, 那么我们称它具有原子性. java 的 concurrent 包下提供了一些原子类, 我们可以通过阅读 API 来了解这些原子类的用法. 比如: AtomicInteger,AtomicLong,AtomicReference 等.
Java 内存模型只保证了基本读取和赋值是原子性操作, 如果要实现更大范围操作的原子性, 可以通过 synchronized 和 Lock 来实现. 由于 synchronized 和 Lock 能够保证任一时刻只有一个线程执行该代码块, 那么自然就不存在原子性问题了, 从而保证了原子性.
有序性
有序性就是程序执行的顺序按照代码的先后顺序执行.
什么是指令重排序, 一般来说, 处理器为了提高程序运行效率, 可能会对输入代码进行优化, 它不保证程序中各个语句的执行先后顺序同代码中的顺序一致, 但是它会保证程序最终执行结果和代码顺序执行的结果是一致的. 指令重排序不会影响单个线程的执行, 但是会影响到线程并发执行的正确性. 也就是说, 要想并发程序正确地执行, 必须要保证原子性, 可见性以及有序性. 只要有一个没有被保证, 就有可能会导致程序运行不正确.
在 Java 内存模型中, 允许编译器和处理器对指令进行重排序, 但是重排序过程不会影响到单线程程序的执行, 却会影响到多线程并发执行的正确性.
在 Java 里面, 可以通过 volatile 关键字来保证一定的 "有序性". 另外可以通过 synchronized 和 Lock 来保证有序性, 很显然, synchronized 和 Lock 保证每个时刻是有一个线程执行同步代码, 相当于是让线程顺序执行同步代码, 自然就保证了有序性.
另外, Java 内存模型具备一些先天的 "有序性", 即不需要通过任何手段就能够得到保证的有序性, 这个通常也称为 happens-before 原则. 如果两个操作的执行次序无法从 happens-before 原则推导出来, 那么它们就不能保证它们的有序性, 虚拟机可以随意地对它们进行重排序.
volatile 原理
java 语言提供了一种稍弱的同步机制, Volatile 可以看做是轻量级的 Synchronized, 即 volatile 变量, 用来将变量的更新操作通知到其他线程. 当把变量声明为 volatile 类型后, 编译器与运行时都会注意到这个变量是共享的, 因此不会将该变量上的操作与其他内存操作一起重排序. volatile 变量不会被缓存在寄存器或者对其他处理器不可见的地方, 因此在读取 volatile 类型的变量时总会返回最新写入的值.
在访问 volatile 变量时不会执行加锁操作, 因此也就不会使执行线程阻塞, 因此 volatile 变量是一种比 sychronized 关键字更轻量级的同步机制.
当对非 volatile 变量进行读写的时候, 每个线程先从内存拷贝变量到 CPU 缓存中. 如果计算机有多个 CPU, 每个线程可能在不同的 CPU 上被处理, 这意味着每个线程可以拷贝到不同的 CPU cache 中.
而声明变量是 volatile 的, JVM 保证了每次读变量都从内存中读, 跳过 CPU cache 这一步.
volatile 作用
1.volatile 可见性
一旦一个共享变量 (类的成员变量, 类的静态成员变量) 被 volatile 修饰之后, 那么就具备了两层语义:
1)保证了不同线程对这个变量进行操作时的可见性, 即一个线程修改了某个变量的值, 这新值对其他线程来说是立即可见的.
2)禁止进行指令重排序.
// 线程 1boolean stop = false;while(!stop){ doSomething();}// 线程 2stop = true;
这段代码是很典型的一段代码, 很多人在中断线程时可能都会采用这种标记办法. 但是事实上, 这段代码会完全运行正确么? 即一定会将线程中断么? 不一定, 也许在大多数时候, 这个代码能够把线程中断, 但是也有可能会导致无法中断线程(虽然这个可能性很小, 但是只要一旦发生这种情况就会造成死循环了).
下面解释一下这段代码为何有可能导致无法中断线程. 在前面已经解释过, 每个线程在运行过程中都有自己的工作内存, 那么线程 1 在运行的时候, 会将 stop 变量的值拷贝一份放在自己的工作内存当中.
那么当线程 2 更改了 stop 变量的值之后, 但是还没来得及写入主存当中, 线程 2 转去做其他事情了, 那么线程 1 由于不知道线程 2 对 stop 变量的更改, 因此还会一直循环下去.
但是用 volatile 修饰之后就变得不一样了:
第一: 使用 volatile 关键字会强制将修改的值立即写入主存;
第二: 使用 volatile 关键字的话, 当线程 2 进行修改时, 会导致线程 1 的工作内存中缓存变量 stop 的缓存行无效(反映到硬件层的话, 就是 CPU 的 L1 或者 L2 缓存中对应的缓存行无效);
第三: 由于线程 1 的工作内存中缓存变量 stop 的缓存行无效, 所以线程 1 再次读取变量 stop 的值时会去主存读取.
那么在线程 2 修改 stop 值时(当然这里包括 2 个操作, 修改线程 2 工作内存中的值, 然后将修改后的值写入内存), 会使得线程 1 的工作内存中缓存变量 stop 的缓存行无效, 然后线程 1 读取时, 发现自己的缓存行无效, 它会等待缓存行对应的主存地址被更新之后, 然后去对应的主存读取最新的值.
那么线程 1 读取到的就是最新的正确的值.
2. 原子性
public class Test { public volatile int inc = 0; public void increase() { inc++; } public static void main(String[] args) { final Test test = new Test(); for(int i=0;i<10;i++){ new Thread(){ public void run() { for(int j=0;j<1000;j++) test.increase(); }; }.start(); } while(Thread.activeCount()>1) // 保证前面的线程都执行完 Thread.yield(); System.out.println(test.inc); }}
这段程序的输出结果是多少? 也许有些朋友认为是 10000. 但是事实上运行它会发现每次运行结果都不一致, 都是一个小于 10000 的数字.
可能有的朋友就会有疑问, 不对啊, 上面是对变量 inc 进行自增操作, 由于 volatile 保证了可见性, 那么在每个线程中对 inc 自增完之后, 在其他线程中都能看到修改后的值啊, 所以有 10 个线程分别进行了 1000 次操作, 那么最终 inc 的值应该是 1000*10=10000.
这里面就有一个误区了, volatile 关键字能保证可见性没有错, 但是上面的程序错在没能保证原子性. 可见性只能保证每次读取的是最新的值, 但是 volatile 没办法保证对变量的操作的原子性.
在前面已经提到过, 自增操作是不具备原子性的, 它包括读取变量的原始值, 进行加 1 操作, 写入工作内存. 那么就是说自增操作的三个子操作可能会分割开执行, 就有可能导致下面这种情况出现:
假如某个时刻变量 inc 的值为 10,
线程 1 对变量进行自增操作, 线程 1 先读取了变量 inc 的原始值, 然后线程 1 被阻塞了;
然后线程 2 对变量进行自增操作, 线程 2 也去读取变量 inc 的原始值, 由于线程 1 只是对变量 inc 进行读取操作, 而没有对变量进行修改操作, 所以不会导致线程 2 的工作内存中缓存变量 inc 的缓存行无效, 也不会导致主存中的值刷新, 所以线程 2 会直接去主存读取 inc 的值, 发现 inc 的值时 10, 然后进行加 1 操作, 并把 11 写入工作内存, 最后写入主存.
然后线程 1 接着进行加 1 操作, 由于已经读取了 inc 的值, 注意此时在线程 1 的工作内存中 inc 的值仍然为 10, 所以线程 1 对 inc 进行加 1 操作后 inc 的值为 11, 然后将 11 写入工作内存, 最后写入主存.
那么两个线程分别进行了一次自增操作后, inc 只增加了 1.
根源就在这里, 自增操作不是原子性操作, 而且 volatile 也无法保证对变量的任何操作都是原子性的.
解决方案: 可以通过 synchronized 或 lock, 进行加锁, 来保证操作的原子性. 也可以通过 AtomicInteger.
在 java 1.5 的 java.util.concurrent.atomic 包下提供了一些原子操作类, 即对基本数据类型的 自增 (加 1 操作), 自减(减 1 操作), 以及加法操作(加一个数), 减法操作(减一个数) 进行了封装, 保证这些操作是原子性操作. atomic 是利用 CAS 来实现原子性操作的(Compare And Swap),CAS 实际上是利用处理器提供的 CMPXCHG 指令实现的, 而处理器执行 CMPXCHG 指令是一个原子性操作.
3.volatile 保证有序性
在前面提到 volatile 关键字能禁止指令重排序, 所以 volatile 能在一定程度上保证有序性.
volatile 关键字禁止指令重排序有两层意思:
1)当程序执行到 volatile 变量的读操作或者写操作时, 在其前面的操作的更改肯定全部已经进行, 且结果已经对后面的操作可见; 在其后面的操作肯定还没有进行;
2)在进行指令优化时, 不能将在对 volatile 变量的读操作或者写操作的语句放在其后面执行, 也不能把 volatile 变量后面的语句放到其前面执行.
- //x,y 为非 volatile 变量
- //flag 为 volatile 变量
- x =2;// 语句 1
- y =0;// 语句 2
- flag =true;// 语句 3
- x =
- 4
- ;// 语句 4
- y = -1;// 语句 5
由于 flag 变量为 volatile 变量, 那么在进行指令重排序的过程的时候, 不会将语句 3 放到语句 1, 语句 2 前面, 也不会讲语句 3 放到语句 4, 语句 5 后面. 但是要注意语句 1 和语句 2 的顺序, 语句 4 和语句 5 的顺序是不作任何保证的.
并且 volatile 关键字能保证, 执行到语句 3 时, 语句 1 和语句 2 必定是执行完毕了的, 且语句 1 和语句 2 的执行结果对语句 3, 语句 4, 语句 5 是可见的.
// 线程 1:context = loadContext(); // 语句 1inited = true; // 语句 2 // 线程 2:while(!inited ){ sleep()}doSomethingwithconfig(context);
volatile 的实现原理
处理器为了提高处理速度, 不直接和内存进行通讯, 而是将系统内部的数据读到内部缓存后在进行操作, 但操作完之后不知道什么时候会写入内存.
如果对声明了 volatile 变量进行写操作时, JVM 会向处理器发送一条 Lock 前缀的指令, 将这个变量所在缓存行的数据写会到系统内存. 这一步确保了如果有其他线程对声明了 volatile 变量进行修改, 则立即更新主内存中数据.
但这时候其他处理器的缓存还是旧的, 所以在多处理器环境下, 为了保证各个处理器缓存一致, 每个处理会通过嗅探在总线上传播的数据来检查 自己的缓存是否过期, 当处理器发现自己缓存行对应的内存地址被修改了, 就会将当前处理器的缓存行设置成无效状态, 当处理器要对这个数据进行修改操作时, 会强制重新从系统内存把数据读到处理器缓存里. 这一步确保了其他线程获得的声明了 volatile 变量都是从主内存中获取最新的.
Lock 前缀指令实际上相当于一个内存屏障(也成内存栅栏), 它确保指令重排序时不会把其后面的指令排到内存屏障之前的位置, 也不会把前面的指令排到内存屏障的后面; 即在执行到内存屏障这句指令时, 在它前面的操作已经全部完成.
volatile 的应用场景
synchronized 关键字是防止多个线程同时执行一段代码, 那么就会很影响程序执行效率, 而 volatile 关键字在某些情况下性能要优于 synchronized, 但是要注意 volatile 关键字是无法替代 synchronized 关键字的, 因为 volatile 关键字无法保证操作的原子性. 通常来说, 使用 volatile 必须具备以下 2 个条件:
1)对变量的写操作不依赖于当前值
2)该变量没有包含在具有其他变量的不变式中
状态标志
也许实现 volatile 变量的规范使用仅仅是使用一个布尔状态标志, 用于指示发生了一个重要的一次性事件, 例如完成初始化或请求停机.
- volatile boolean shutdownRequested;
- ...
- public void shutdown() {
- shutdownRequested = true;
- }
- public void doWork() {
- while (!shutdownRequested) {
- // do stuff
- }
- }
线程 1 执行 doWork()的过程中, 可能有另外的线程 2 调用了 shutdown, 所以 boolean 变量必须是 volatile.
而如果使用 synchronized 块编写循环要比使用 volatile 状态标志编写麻烦很多. 由于 volatile 简化了编码, 并且状态标志并不依赖于程序内任何其他状态, 因此此处非常适合使用 volatile.
这种类型的状态标记的一个公共特性是: 通常只有一种状态转换; shutdownRequested 标志从 false 转换为 true, 然后程序停止. 这种模式可以扩展到来回转换的状态标志, 但是只有在转换周期不被察觉的情况下才能扩展(从 false 到 true, 再转换到 false). 此外, 还需要某些原子状态转换机制, 例如原子变量.
一次性安全发布
在缺乏同步的情况下, 可能会遇到某个对象引用的更新值 (由另一个线程写入) 和该对象状态的旧值同时存在.
这就是造成著名的双重检查锁定 (double-checked-locking) 问题的根源, 其中对象引用在没有同步的情况下进行读操作, 产生的问题是您可能会看到一个更新的引用, 但是仍然会通过该引用看到不完全构造的对象
未完待续
来源: https://juejin.im/post/5ad1adea6fb9a028c67624e9