JVM 是 JAVA 平台的重要组成之一, 因涉及知识点太多, 故从以下几个方面对 JVM 进行浅层面的介绍, 如果需要深入理解, 推荐学习机械工业出版社的深入理解 JAVA 虚拟机.
一, JAVA 内存结构
Java 虚拟机规范中规定的 JVM 运行时数据区如下图所示:
总体来说, 分为线程共享部分 (方法区, 堆) 和线程隔离区(虚拟机栈, 本地方法栈和程序计数器).
1. 方法区
用于存储已被虚拟机加载的类信息, 常量, 静态变量, 即时编译器编译后的代码等数据. 其中常量存储于运行时常量区中, 运行时常量区是区的一部分, 用于存储编译期生成的字面量和符号引用. 但运行时常量区的内容并不只是在编译期间产生, 通过 String.intern()也可以实现在运行时向常量区中添加内容.
2. 堆
是 JVM 中最大的一块内存区域, 该区域的目的只是用于存储对象实例及数组. 该区域也是 GC 的最主要区域.
3. 虚拟机栈
每个线程方法在执行时都会创建一个栈帧, 包含局部变量表, 返回地址, 操作数栈等信息. 每个方法的执行与完成就对应的栈帧的入栈与出栈过程 . 局部变量表占用空间的大小在编译期就确定了.
4. 本地方法栈
与虚拟机栈类似, 不过其中执行是本地方法. 对于 HotSpot 虚拟机而言, 本地方法栈和虚拟机栈是统一的.
5. 程序计数器
是一个小的内存空间, 如果线程正在执行的是一个 java 方法, 则此内存区域记录正在执行的虚拟机字节码指令; 如果线程正在执行的是 native 方法, 则计算器中的值为空.
二, JAVA 垃圾回收机制
JAVA 的垃圾回收主要涉及到确定对象是否存活, 垃圾收集等算法, 其中确定对象回收算法采用的是可达性分析算法, 垃圾收集目前各 JVM 厂商广泛采用的是分代收集算法. 这里面主要描述下分代收集算法的过程.
分代收集算法的核心思想是将内存区域按照对象的生存周期阶段进行划分, 其中将堆区划分为新生代 (young generation) 和老年代 (old generation). 将非堆区(一般指方法区) 划分为持久代(permanent generation).
1. 新生代
新生代又可再分为 Eden 区和两个 Survivor 区(两个 Survivor 区的大小是一样的, 便于交换). 新生成的对象都会先在新生代的 Eden 区进行保存. 新生代的特点是每次垃圾回收都会有大量的内存被回收, 而且收集比较频繁, 所以新生代适合如下的收集算法:
首先, 新生成的对象分配到 Eden 区, 如果 eden 区满了, 则将可达性的对象复制到 survivor1 区, 后清空 eden 区.
然后, 如果 survivor1 区满了, 则将 eden 区与 survivor1 区的可达性对象复制到 survivor2 区, 后清空 eden 区和 survivor1 区, 清空完后将 survivor2 区与 survivor1 区交换, 即保持 survivor2 是空的.
再次, 如果 survivor2 区也满了, 则将 eden 区, survivor1 区, survivor2 区的可达性对象复制到老年代中, 并清空新生代中.
最后, 如果老年代也满了, 就触发 full gc 了.
2. 老年代
老年代的内存比新生代大的多, 这个区域执行垃圾回收的频度不高. 当老年代满时, 会触发 full gc.
3. 持久代
持久代一般指方法区, 该区需要回收的有废弃的常量和类. 对于常量可用可达性分析的方法进行判断回收, 对于类则需要同时满足以下条件才会被回收:
首先, 该类的所有实例对象都已被回收;
其次, 该类的类加载器也已被回收;
再次, 该类的 Class 方法没有在任何地方被引用, 即无法通过在任何地方通过反射访问到该类的方法.
4. 什么时候会解决垃圾回收?
综上所述, 当 eden 满时, 就会触发 scavenge gc, 当出现以下情况时会触发 full gc:
老年代已满;
持久代已满;
调用 System.gc()方法;
三, JAVA 类加载过程
JVM 类加载过程具体装载, 验证, 准备, 解析, 初始化这五个部分.
1. 装载
在装载过程中, 需要完成以下事情:
1)通过类的全限定名获取类的二进制字节流;
2)将类的二进制字节流转换为方法区的运行时数据结构;
3)生成一个代表此类的 java.lang.Class 对象, 作为方法区这个类的各种数据的访问入口.
2. 验证
验证, 解析和初始化又称为是连接阶段, 在验证验证主要是确保二进制字节流符合 JVM 的规范, 不会危害计算机的安全. 具体验证阶段需要做的事情如下:
1)文件格式验证, 验证字节流是否符合 Class 文件格式规范;
2)元数据验证, 对字节码进行语义验证, 以保证其描述信息符合 JAVA 语言规范;
3)字节码验证, 通过数据流和控制流分析, 确定程序语义是合法的, 符合逻辑的;
4)符号引用验证, 对常量池中的各种符号引用的信息进行匹配性验证.
3. 准备
准备的过程其实是分配内存的过程. 在这个阶段有两个容易产生混淆的概念: 一是此阶段分配内存的只是类变量 (static 变量), 不包含实例变量, 实例变量的内存分配是在对象实例化时随对象一起分配在堆中; 二是该阶段分配内存中保存的值只是数据类型的零值, 具体值需要在初始化阶段进行赋值. 也有特殊情况, 就是对于静态常量(final 修饰) 会在准备阶段将值赋值为真实值.
4. 解析
解析阶段就是将常量池内折符号引用转换为直接引用的过程, 具体包括类和接口的解析, 字段的解析, 方法的解析, 接口方法和解析.
5. 初始化
初始化阶段其实就是执行类构造函数 (clinit) 的阶段. 对于 clinit()需要说明以下几点:
1)clinit()中的程序是自动收集类中 static 变量及 static 块产生的, 执行顺序与代码中的顺序一致. 静态语句块中只能访问在其之前声明的 static 变量, 在其之后声明的 static 变量只能赋值, 不能访问.
2)执行 clinit()方法前, JVM 会自动调用父类的 clinit()方法;
3)虚拟机会保证一个类的 clinit()在多线程环境中, 自动加锁, 同步.
四, JVM 的类加载器
JVM 的类加载是通过类加载器实现的, 常用的类加载器包括下面三种:
1. 启动类加载器(bootstrap classloader): 加载{JDK_HOME}/lib 下的类
2. 扩展类加载器(extension classloader): 加载{JDK_HOME}/lib/ext 下的类
3. 应用程序类加载器(application classloader): 加载 classpath 指定的类
对于不同类加载器以及他们之间的协作可以参考下面的双亲委派模型.
双亲委派模型的工作过程是: 如果一个类加载器收到了类的加载请求, 会首先把请求委派给自己的父类, 每个层次的类加载器都会如此, 因为所有的加载请求最终都会发送到 bootstarp 加载器中, 只有当父加载器确实无法自己完成加载请求时, 子加载器才会尝试自己加载.
双亲委派模型使得 JAVA 类能够按层次进行加载, 不会造成混乱.
五, JVM 的相关工具
JDK 中有很多强大的监控工具, 可以直接在命令行运行. 这对于在生产环境进行监控是非常有用的. 例如 SUN JDK 中就包含了以下监控和故障处理工具.
jps: jvm process status tool, 显示指定系统内所有的 hotspot 虚拟机进程
jstat: jvm statistics monitoring tool, 用于收集 hotspot 虚拟机各方面的运行数据
jinfo: configuration info for java, 显示虚拟机配置信息
jmap: memory map for java, 生成虚拟机的内存转储快照(heapdump 文件)
jhat: jvm heap dump browser, 用于分析 heapmap 文件, 它会建立一个 http/html 服务器, 让用户可以在浏览器上查看分析结果
jstack: stack trace for java , 显示虚拟机的线程快照
先介绍这么多, 后面有机会再介绍 JVM 在并发方面的相关支持.
来源: https://www.cnblogs.com/jpcflyer/p/9226988.html