type
status
date
slug
summary
tags
category
password
一、垃圾回收简介
1、什么是垃圾回收(GC)
垃圾(Garbage)是指在程序中不再被引用的对象或数据,垃圾回收(Garbage Collection,GC)就是回收程序中这些没有被引用的对象或数据。如果不对垃圾对象进行回收,那么这些垃圾占用的内存空间会一直保留到应用程序结束,这些内存无法被其它对象使用,甚至会导致内存溢出。
回收垃圾的过程分为标记和清理两个阶段(这里并非垃圾回收算法)。
- 标记阶段:通过一系列算法标准来判断一个对象是否为垃圾,标记阶段在执行时会暂停用户线程,俗称 Stop The World,简称 STW。
- 清理阶段:通过垃圾收集器执行回收。
2、标记算法
常用的标记算法有两种:
- 引用计数器算法
- 可达性分析算法
引用计数法
引用计数法的原理是在对象中添加一个引用计数器,每当有一个地方引用它时,该对象的引用计数器就加 1;当引用失效的时候,引用计数器就减 1。当对象的引用计数器为 0,说明对象没有被引用,可进行回收。
优点:
实现简单,垃圾对象便于辨识;判定效率高,回收没有延迟性。
缺点:
- 无法回收循环引用。若两个或多个对象互相引用(如双向链表、父对象持有子对象且子对象反向引用父对象),它们的引用计数永远不会归零,即使这些对象已不可达,也无法被回收。
- 空间开销:因为需要单独的字段存储计数器,增加了存储空间的开销。
- 性能开销:每次引用赋值或销毁时都需要增减计数,尤其在多线程环境下需保证原子性,增加了额外的同步开销。
注意引用计数法只是没有在 Java 中使用,不代表这个算法没有实用价值。引用计数算法是很多语言的资源回收选择,例如因人工智能而更加火热的 Python,它更是同时支持引用计数和垃圾收集机制。Python 如何解决循环引用?
- 手动解除:很好理解,就是在合适的时机,解除引用关系。
- 使用弱引用 weakref, weakref 是 Python 提供的标准库,旨在解决循环引用。
可达性分析算法
可达性分析算法是指:以根对象集合(GC Roots)为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到 GC Roots 没有任何引用链相连时,则证明此对象是不可达的,可以被回收。
可以作为 GC Roots 的对象有:
- Class 对象:由系统类加载器(system class loader)加载的对象,这些类是不能够被回收的,例如基本数据类型对应的 Class 对象、一些常驻的异常对象(如:NullPointerException、OutOfMemoryError) 、系统类加载器。他们可以以静态字段的方式保存持有其它对象。我们需要注意的一点就是,通过用户自定义的类加载器加载的类,除非相应的 java.lang.Class 实例以其它的某种(或多种)方式成为 roots,否则它们并不是 roots。
- 静态变量引用的对象:即类中
static
修的成员变量。
- 常量引用的对象:即类中
final static
修饰的成员变量。
- 虚拟机栈中引用的对象:例如当前正在运行的方法中的局部变量、参数等
- 本地方法栈中 JNI 引用的对象:即 Native 方法引用的对象
- 同步锁持有的对象:所有被同步锁
synchronized
持有的对象
- JMXBean、JVMTI 中注册的回调、本地代码缓存等
注意:
- 在可达性分析算法中,只有能够被根对象集合直接或者间接连接的对象才是存活对象。
- 如果要使用可达性分析算法来判断内存是否可回收,那么分析工作必须在一个能保障一致性的快照中进行。这点不满足的话分析结果的准确性就无法保证。这点也是导致 GC 进行时必须 Stop The World 的一个重要原因。即使是号称(几乎)不会发生停顿的 CMS 收集器中,枚举 GC Roots 时也是必须要停顿的。
由于 Root 采用栈方式存放变量和指针,所以如果一个指针,它保存了堆内存里面的对象,但是自己又不存放在堆内存里面,那它就是一个 Root。

Stop The World
Stop-the-World(STW)指的是 GC 过程中所有应用线程都被刮起,只有 GC 线程在工作。对用户来说表现就是整个应用程序发生停顿,没有任何响应,有点像卡死的感觉,被 STW 中断的应用程序线程会在完成 GC 之后恢复。频繁中断会降低用户体验,所有我们需要减少 STW 的发生。
为什么会发生 STW?
可达性分析工作必须在一个确保一致性的快照进行,一致性快照指分析期间整个执行系统看起来像被冻结在某个时间点上,在这个时间点上对象引用关系不会再发生变化。所以 STW 就是确保可达性分析期间对象的引用关系不会再发生,可以得到准确的对象引用关系分析结果。
STW 事件和采用哪款 GC 无关,所有的 GC 都有这个事件。GC Roots 的枚举一定会发生 STW,哪怕是 G1 也不能完全避免 Stop-the-world 情况发生,只能说垃圾回收器越来越优秀,回收效率越高,尽可能地缩短了暂停时间。不同 GC 算法中的 STW:
- Serial GC:完全 STW
- Parallel GC:多线程回收但仍有 STW
- CMS:初始标记和重新标记阶段 STW
- G1:年轻代回收和混合回收有 STW
- ZGC/Shenandoah:通过读屏障等技术极大减少STW时间
3、垃圾回收算法
垃圾回收算法 | 算法 | 优点 | 缺点 |
标记-清除算法(mark-sweep) | 当堆中的有效空间(available memory)被耗尽时,就会停止整个程序(STW),然后执行标记和清除的操作。
1、标记:采用可达性分析算法,从引用根节点遍历,标记所有被引用的对象,一般是在对象的对象头(Header)中记录为可达对象。
2、清除:对堆内存中的所有对象进行从头到尾的线性遍历,如果发现某个对象在其对象头中没有被标记为可达对象,则就将该对象所占用的内存回收。
注意:这里的清除,并不是真的把对应的内存置空,而是把需要清除的对象地址保存在空闲的地址列表中,等有新对象需要分配内存空间时,会判断垃圾对象的位置空间是否足够。若足够,则分配给新对象。 | 简单易实现 | 1、效率不高。因为标记和清除都要进行遍历,这也意味着标记和清除两个过程都会因为对象的增加而效率下降。
2、空间碎片化。这种方式清理出来的空闲空间是不连续的,产生了内存碎片问题。故需要维护一个空闲列表,才能知道新对象该如何分配内存。而碎片问题可能会导致,即使内存空间足够,大对象依然有可能无法存放的问题。 |
复制算法(copying) | 将内存空间分为大小相等的两块,每次只使用其中的一块。在垃圾回收时,将正在使用的内存块中标记为存活的对象复制到未被使用的内存块中,然后一次性清理正在使用的内存块中的所有对象,交换两个内存块的角色,完成垃圾回收。 | 1、实现比较简单,不需要空闲链表的存在,直接移动指针分配内存,所以效率很高。
2、复制过去后保证了空间的连续性,不会出现“碎片问题”。 | 1、可用内存空间缩小了一半,浪费了原来的内存。
2、由于需要复制对象至另一半空间,故有一定的性能开销。
3、因为对象地址空间被改变,所以在复制过去后,还用花费一定的时间开销来维护对象之间的引用关系。比如,如果栈中的引用指向了堆中某块内存,经过复制算法后,还要把这个引用进行修改才行。 |
标记-压缩算法(mark-compact) | 标记-清除算法在在标记-清除算法上进行改进:
1、标记:与标记-清除算法一样,从根节点开始标记所有被引用的对象。
2、压缩:将所有存活对象压缩(移动)到内存的一端,按顺序排放。
3、清理边界外所有的空间。
标记-整理算法的最终效果等同于标记-清除算法执行完成后,再进行一次内存碎片的整理。二者的本质差异在于,标记-清除算法是非移动式的回收算法,而标记-整理算法是移动式的。 | 1、消除了标记-清除算法中产生的碎片问题。我们需要给新对象分配内存时,只需要一个内存的起始地址即可。
2、消除了复制算法中,内存减半的高额代价。 | 1、从效率上看,标记-整理算法要低于复制算法和标记-清除算法。
2、移动对象的同时,如果对象被其他对象引用,则还要调整引用地址
3、移动过程中,需要全程暂停用户的应用程序(STW) |
分代收集算法 | 根据不同对象的生命周期不同,采用不同的收集方式分代收集算法,严格来说分代收集算法应该是一种垃圾收集的理论。
分代收集算法一般把堆内存分成新生代和老年代:
1、新生代:区域相对老年代较小,对象生命周期短,存活率低,垃圾回收频繁。使用复制算法,通常一次可以回收70%-99%的内存空间,回收性价比很高。
2、老年代:区域较大,对象生命周期长,存活率高,回收不如新生代频繁。使用标记-清除算法或者是由标记-清除算法和标记-整理算法混合实现。 | 回收性价比最高,目前,几乎所有的垃圾收集器都采用了分代收集算法执行垃圾回收。 | 长时间STW可能影响用户体验 |
增量收集算法 | 上述的算法在垃圾回收过程中都不可避免的处于一种Stop The World 的状态。在STW状态下,程序所有的用户线程都会挂起,暂停一切正常工作,等待垃圾回收的完成。如果垃圾回收时间过长,应用程序被挂起很久,将严重影响用户体验或者系统的稳定性。
增量收集算法的思想:如果一次性将所有的垃圾进行处理,需要造成系统长时间的停顿,那么可以让垃圾收集线程和应用线程交替执行。每次,垃圾收集线程只收集一小片区域的内存空间,接着切换到应用程序线程。如此反复,直到垃圾收集完成。
增量收集算法的基础仍然是传统的标记-清除和复制算法。增量收集算法通过对线程间冲突的处理,允许垃圾收集线程以分阶段的方式完成垃圾标记、清理或者复制工作。 | 减少了系统的停顿时间,优化了用户体验。 | 因为线程切换和上下文转换的消耗,会降低系统整体吞吐量 |
4、四种对象引用
Java 提供了四种不同强度的引用类型,用于更灵活地管理内存和对象生命周期:
- 强引用(StrongReference):无法被回收。最传统的 “引用” 的定义,是指在程序代码之中普遍存在的引用赋值,即类似
object obj = new object ( )
这种引用关系。无论任何情况下,只要强引用关系还存在,垃圾收集器就永远不会回收掉被引用的对象。
- 软引用(SoftReference):内存不足即回收。在系统将要发生内存溢出之前,将会把这些对象列入回收范围之中进行第二次回收。如果这次回收后还没有足够的内存,才会抛出内存溢出异常。
- 弱引用(WeakReference) :发生垃圾收集(full gc)即回收。被弱引用关联的对象只能生存到下一次垃圾收集之前。当垃圾收集器工作时,无论内存空间是否足够,都会回收掉被弱引用关联的对象。
- 虛引用(PhantomReference):不影响回收,对象回收跟踪。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虛引用来获得一个对象的实例。为一个对象设置虛引用关联的唯一目的就是能在这个对象被收集器回收时收到一个系统通知。
强引用
在 Java 程序中,最常见的引用类型是强引用(普通系统 99% 以上都是强引用),也就是我们最常见的普通对象引用,也是默认的引用类型。当在 Java 语言中使用 new 操作符创建一个新的对象, 并将其赋值给一个变量的时候, 这个变量就成为指向该对象的一个强引用。
对于一个普通的对象,如果没有其他的引用关系,只要超过了引用的作用域或者显式地将相应(强)引用赋值为 null,就是可以当做垃圾被收集了,当然具体回收时机还是要看垃圾收集策略。
测试代码:
输出如下:
可以看到即使发生了 OOM,垃圾回收器也不会回收强引用关联的对象
软引用
软引用是用来描述一些还有用,但非必需的对象。只被软引用关联着的对象在系统将要发生内存溢出异常前,会把这些对象列进回收范围之中进行第二次回收。如果这次回收还没有足够的内存,才会抛出内存溢出异常。
软引用通常用来实现内存敏感的缓存。比如:高速缓存就有用到软引用。如果还有空闲内存,就可以暂时保留缓存,当内存不足时清理掉,这样就保证了使用缓存的同时,不会耗尽内存
软引用一般会和引用队列(ReferenceQueue)搭配使用,在构造软引用的时候指定一个 ReferenceQueue。ReferenceQueue 用于跟踪被回收的引用对象,当引用指向的对象被垃圾回收后,引用本身会被加入到队列中。
测试代码:
输出如下:
可以看到第一次手动调用
System.gc()
触发 full gc 的时候,因为内存充足,所以不会回收软引用的对象;第二次因为内存不足触发 full gc 的时候,软引用对应的对象就被回收放到了引用队列。弱引用
弱引用也是用来描述那些非必需对象,只被弱引用关联的对象只能生存到下一次垃圾收集发生为止。在系统 GC 时,只要发现弱引用,不管系统堆空间使用是否充足,都会回收掉只被弱引用关联的对象。
但是,由于垃圾回收器的线程通常优先级很低,因此,并不一定能很快地发现持有弱引用的对象。在这种情况下,弱引用对象可以存在较长的时间。另外,弱引用和软引用一样,一般和引用队列(ReferenceQueue)搭配使用。
测试代码:
输出如下:
可以看到在内存充足的时候发生 full gc,弱引用的对象也会被回收。
软引用、弱引用都非常适合来保存那些可有可无的缓存数据。如果这么做,当系统内存不足时,这些缓存数据会被回收,不会导致内存溢出。而当内存资源充足时,这些缓存数据又可以存在相当长的时间,从而起到加速系统的作用。
虚引用
也称为 “幽灵引用” 或者 “幻影引用” ,是所有引用类型中最弱的一个。无法通过虚引用获取对象实例,主要用于跟踪对象被回收的状态。
一个对象是否有虚引用的存在,完全不会决定对象的生命周期。如果一个对象仅持有虚引用,那么它和没有引用几乎是一样的,随时都可能被垃圾回收器回收
无法通过虚引用来获取被引用的对象。当试图通过虚引用的 get() 方法取得对象时,总是 null。
虚引用不能单独使用,必须和引用队列(ReferenceQueue)一起使用。虚引用在创建时必须提供一个引用队列作为参数。当垃圾回收器准备回收一个对象时,如果发现它还有虚引用,就会在回收对象后,将这个虚引用加入引用队列,以通知应用程序对象的回收情况。可以通过判断引用队列中是否已经加入了虚引用,来了解被引用的对象是否将要被垃圾回收。
为一个对象设置虚引用关联的唯一目的在于跟踪垃圾回收过程。比如:能在这个对象被收集器回收时收到一个系统通知。因此,也可以将一些资源释放操作放置在虛引用中执行和记录。
测试代码:
输出如下:
可以看到不管虚引用的对象是否被回收,都无法通过
get()
来获取虚引用的对象。5、finalize机制
当垃圾回收器在回收对象之前会先调用这个对象的
finalize()
方法。 finalize()
方法允许在子类中被重写,通常在这个方法中进行一些资源释放和清理的工作,比如关闭文件、套接字和数据库连接等。finalize()
只会被调用一次。注意:永远不要主动调用某个对象的
finalize()
方法,应该交给垃圾回收机制调用。理由包括下面三点:- 在
finalize()
时可能会导致对象复活。
finalize()
方法的执行时间是没有保障的,它完全由GC线程决定,极端情况下,若不发生GC,则finalize()
方法将没有执行机会。
- 一个糟糕的
finalize()
会严重影响 GC 的性能。
finalize()
方法可以用来复活要被回收的对象(但不推荐这种用法)。可以在 finalize()
方法中通过将当前对象重新赋值给一个静态变量或可达引用来“复活”对象。垃圾回收加上 finalize()
的调用过程之后,判定一个对象 objA 是否可回收,至少要经过两次标记过程:- 如果对象 objA 到 GC Roots 没有引用链,则进行第一次标记。
- 进行筛选,判断此对象是否有必要执行
finalize()
方法。 - 如果对象 objA 没有重写
finalize()
方法,或者finalize()
方法已经被虚拟机调用过,则虚拟机视为"没有必要执行",objA 被判定为不可触及,加入被回收的集合。 - 如果对象 objA 重写了
finalize()
方法,且还未执行过,那么 objA 会被插入到F-Queue
队列中,由一个虚拟机自动创建的、低优先级的 Finalizer 线程触发其finalize()
方法。 - finalize() 方法是对象逃脱死亡的最后机会。稍后 GC 会对
F-Queue
队列中的对象进行第二次标记。如果 objA 在finalize()
方法中重新赋值给一个静态变量或可达引用,那么在第二次标记时,objA 会被移出"即将回收"集合。 - 之后,如果对象会再次出现没有引用存在的情况。在这个情况下,
finalize()
方法不会被再次调用,对象会直接变成不可触及的状态,也就是说一个对象的finalize()
方法只会被调用一次。
6、GC的安全点和安全区域
OopMap
JVM 采用的可达性分析法有个缺点,就是从
GC Roots
找引用链耗时。都说他耗时,他究竟耗时在哪里?GC 进行扫描时,需要查看每个位置存储的是不是引用类型,如果是,其所引用的对象就不能被回收;如果不是,那就是基本类型,这些肯定是不会引用对象的。这种对 GC 无用的基本类型的数据非常多,每次 GC 都要去扫描,显然是非常浪费时间的。
而且迄今为止,所有收集器在
GC Roots
枚举这一步骤都是必须暂停用户线程的。那有没有办法减少耗时呢?一个很自然的想法,能不能用空间换时间,把栈上的引用类型的位置全部记录下来,这样到 GC 的时候就可以直接读取,而不用一个个扫描了。Hotspot 就是这么实现的,这个用于存储引用类型的数据结构叫
OopMap
。OopMap(Ordinary Object Pointer Map)
用来存储栈帧和寄存器中哪些位置包含对象引用。OopMap 中存储了两种对象的引用:- 栈帧和寄存器内的引用。在即时编译中,在特定的位置记录下栈里和寄存器里哪些位置是引用。在 JVM中,一个线程为一个栈,一个栈由多个栈桢组成,一个栈桢对应一个方法,一个栈帧可能有多个 OopMap。
- 对象内的引用。比如一旦类加载动作完成的时候, HotSpot 就会把对象内什么偏移量上是什么类型的数据计算出来。注:把存储单元的实际地址与其所在段的段地址之间的距离称为段内偏移,也称为有效地址或偏移量,因此,实际地址 = 所在段的起始地址 + 偏移量。
假设,这两个方法都只有一个 OopMap,并且是在方法返回之前:
那么 testMethod1() 和 testMethod2() 的 OopMap 如下图所示:

安全点
在程序执行的过程中,对象之间的引用关系随时都会发生改变,这意味着对应的
OopMap
需要同步进行更新。如果每一条指令的执行,都生成(或更新)对应的 OopMap
,那么将会占用大量的内存空间,增加了 GC 的空间成本。针对这个问题,JVM 引入了 Safe Point 的概念。 Safe Point 是代码中的特定位置,在这些位置 JVM 可以安全地执行一些特殊操作,包括:- 发生 STW 的时候用户线程要跑到 Safe Point 挂起。当 GC 回收需要停止用户线程的时候,用户线程不能随意挂起。JVM 设置某个全局中断标志位,各个线程不断轮询这个标志位,发现需要挂起时,自己跑到最近的安全点,更新完
OopMap
才能挂起。
- 只有在 Safe Point 才会生成(或更新)对应的
OopMap
。
安全点不是任意的选择,既不能太少以至于让收集器等待时间过长,也不能过多以至于过分增大运行时的内存负荷。适合放置 Safe Point 有:
- 所有的非计数循环的末尾(防止循环体的执行时间太长,一直进入不了 Safe Point)。
- 所有调用方法的入口。
- 所有方法返回之前。
- 抛出异常的位置。
如下所示,在
tesMethod2()
方法返回之前插入 Safe Point,用户线程进入 Safe Point 之后才会更新 OopMap
。
注意:
- Safe Point 的数量不能太少,太少会导致进入 Safe Point 的前置时间过长,以至于垃圾回收线程等待的时间太长。
- Safe Point 的数量也不能太多,太多意味着将会频繁生成(或更新)OopMap ,会有性能损耗。
当所有线程都到达 Safe Point,有两种方法中断线程:
- 抢占式中断(Preemptive Suspension)。JVM 会中断所有线程,然后依次检查每个线程中断的位置是否为 Safe Point,如果不是则恢复用户线程,让它执行至 Safe Point 再阻塞。目前很少 JVM 采用这种方案,
- 主动式中断(Voluntary Suspension)。大部分 JVM 实现都是采用主动式中断,需要阻塞用户线程的时候,首先做一个标志,用户线程会主动轮询这个标志位,如果标志位处于就绪状态,就自行中断。
安全区域
实际情况中 Safe Point 仍然存在缺陷。如果线程正常执行,Safe Point 可以发挥很好的作用。可如果线程没有执行呢?即线程没有分配到 CPU 片,例如:线程处于 Sleep 状态或者 Blocked 状态,那么线程就无法达到 Safe Point。
针对这个问题,JVM 引入了 Safe Region 的概念,解决当线程处于 Sleep 状态或 Blocked 状态时,无法响应 JVM 的中断请求并移动到安全点的问题。Safe Region 是一片区域,在这个区域的代码片段,引用关系不会发生变化,因此,在 Safe Region 中任意地方开始垃圾收集都是安全的。
Safe Region 的工作流程可以分为以下几个阶段:
- 进入 Safe Region:线程执行到 Safe Region 时,首先标记自己已经进入 Safe Region。这个标识告诉 JVM 该线程当前处于安全状态。
- GC 发生时的处理:如果在安全区域内发生 GC,JVM 会忽略那些已经标识为处于 Safe Region 状态的线程,不会强制它们暂停。
- 离开 Safe Region:当线程将要离开 Safe Region 时,线程需要检查 JVM 是否已经完成 GC Roots 枚举。如果尚未完成,则需要一直等待,直到 GC Roots 枚举完成。

安全区域的典型应用场景:
- 线程休眠(Sleep):当线程调用
Thread.sleep()
方法时,它会进入安全区域,直到休眠结束。
- 线程阻塞(Blocked):当线程因为等待 I/O 操作或锁而阻塞时,它也会进入安全区域。
- JNI 调用:在执行本地方法(JNI 调用)时,Java线 程可能无法及时响应 JVM 的中断请求,这时也需要安全区域机制。
OopMap、Safe Point 和 Safe Region 的关联和区别。
关联:
- HotSpot 使用 OopMap 把引用类型的指针记录下来,提高 GC Roots 枚举的效率。
- 为了减少更新 OopMap 的开销,引入了 Safe Point。GC 发生 STW 时,线程需要跑到距离自己最近的安全点,更新完 OopMap 才能挂起。
- 处于 Sleep 或者 Blocked 状态的线程无法跑到安全点,需要引入 Safe Region。GC 的时候,不会去管处于安全区域的线程,线程离开安全区域的时候,如果处于 STW 则需要等待直至恢复。
区别:
- 安全点主要针对正在执行的线程,而安全区域针对那些无法立即响应中断的非活动线程。安全区域可以看作是安全点的扩展,它扩大了 GC 可以安全执行的范围。
7、吞吐量和暂停时间
吞吐量(Throughput)和暂停时间(Pause Time)是衡量系统性能(特别是垃圾回收性能)的两个重要指标:
- 吞吐量:运行用户代码的时间占总运行时间的比例,计算公式为
吞吐量 = 用户线程运行时间 / (用户线程运行时间 + 垃圾收集时间)
,高吞吐量可能对每次 STW 时长没有要求,只要求在单位时间内 STW 总时长最短。
- 暂停时间:执行垃圾回收时用户线程被暂停的时间,即每次 STW 的时长。

从用户角度来说:
- 高吞吐量意味着大量时间都是应用程序线程在做 “生产性” 工作,吞吐量越高,程序单位时间内完成的任务越多,但是用户体验可能卡顿明显。例如上面的单位时间内发生了两次停顿,每次200ms,虽然大部分时间都是用户线程在工作,但是每次停顿时间过长,从用户体验的角度来看可能就是界面一卡一卡的。
- 低暂停时间意味着每次停顿的时间少,暂停时间越短,程序越流畅不卡顿,用户体验更好,但是单位时间内完成的任务可能不多。例如上面单位时间内发生了五次停顿,每次 100ms,暂停的总时间更多,导致用户线程的工作总时间减少,但是因为每次停顿时间短,从用户体验的角度来看可能就是界面流畅,但是程序完成的任务不多。
由此看出来,“高吞吐量” 和 “低暂停时间” 是一对相互竞争的目标:
- 如果选择以吞吐量优先,那么必然需要降低内存回收的执行频率,但是这样会导致 GC 需要更长的暂停时间来执行内存回收。
- 如果选择以低延迟优先,那么为了降低每次执行内存回收时的暂停时间,也只能频繁地执行内存回收,但这又引起了年轻代内存的缩减和导致程序吞吐量的下降。
8、串行、并行和并发垃圾回收器
垃圾回收器的串行、并行和并发主要区别在于垃圾回收线程的工作方式以及是否与应用线程同时执行。
- 串行垃圾回收器:单线程进行垃圾回收,此时用户线程仍然处于等待状态。
- 并行垃圾回收器:多线程程并行执行垃圾回收,但此时用户线程仍然处于等待状态。
- 并发垃圾回收器:垃圾回收线程和用户线程同时执行(但不一定是并行的,可能会交替执行),此时垃圾回收线程可以是单线程或多线程。

二、垃圾回收器
1、垃圾回收器介绍
如果说收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现。
Java虚拟机规范中对垃圾收集器应该如何实现并没有任何规定,因此不同的厂商、版本的虚拟机所提供的垃圾收集器都可能会有很大差别,并且一般都会提供参数供用户根据自己的应用特点和要求组合出各个年代所使用的收集器。
下面是七种常用的垃圾回收器:
垃圾收集器 | 分代 | 算法 | 执行模式 | 使用场景 | 特点 |
Serial GC | 新生代 | 复制 | 串行 | Client 模式下的默认新生代收集器,适用于单CPU场景 | 没有线程切换,简单高效 |
ParNew GC | 新生代 | 复制 | 并行 | 很多 JVM 在Server模式下的默认新生代收集器,适用于多 CPU 场景。唯一能和 CMS 搭配使用的并行收集器。 | Serial GC的多线程版本,其他几乎没区别,在多CPU情况下比Serial GC高效,但是单CPU情况下可能更慢。 |
Parallel Scavenge GC | 新生代 | 复制 | 并行 | Java8 的默认新生代收集器,适用于后台计算等不需要太多交互的场景。 | 高吞吐量,尽快完成计算任务 |
Serial Old GC | 老年代 | 标记-压缩 | 串行 | Client 模式下的默认老年代收集器,Server 模式下和 Parallel Scavenge GC 搭配使用,或者作为 CMS 的后备方案。 | 没有线程切换,简单高效 |
Parallel Old GC | 老年代 | 标记-压缩 | 并行 | Java8 的默认老年代收集器,主要是为了和Parallel Scanvenge GC 搭配使用。 | 同Parallel Scanvenge GC |
CMS GC | 老年代 | 标记-清除 | 并发 | 适用于 B/S 等追求高响应速度的场景,只能和 Serial GC 或 ParNew GC 搭配使用。 | 低延迟,第一款并发收集器 |
G1 GC | 新生代 + 老年代 | ㅤ | 并发 + 并行 | 主要面向服务端,针对多 CPU 和大内存的机器,在尽量满足 GC 停顿时间的同时提高吞吐量。 | 延迟可控的情况下尽可能提高吞吐量 |
ZGC | 新生代 + 老年代 | ㅤ | 并发 + 并行 | 适合现代大内存、低延迟的应用场景,设计目标是将任意大小的堆内存的 GC 停顿时间控制在 10ms 以内,且不随堆大小增长而增加。 | JDK 11 引入,JDK 15中成为正式功能,代表现代 Java 垃圾收集技术的最新发展。 |
从串行、并行、并发角度分类:
- 串行回收器:Serial、Serial Old
- 并行回收器:ParNew、Parallel Scavenge、Parallel Old
- 并发回收器:CMS、G1
从垃圾分代角度分类:
- 新生代收集器:Serial、ParNew、Parallel Scavenge
- 老年代收集器:Serial Old、Parallel Old、CMS
- 整堆收集器:G1
垃圾回收器搭配使用关系:

- 两个收集器间有连线,表明它们可以搭配使用:Serial GC + Serial Old、Serial + CMS、ParNew + Serial Old、ParNew + CMS、Parallel Scavenge + Serial Old、Parallel Scavenge + Parallel Old、G1。
- 其中 Serial Old 作为 CMS 出现 “Concurrent Mode Failure" 失败的后备预案。
- (红色虚线)由于维护和兼容性测试的成本,在 JDK 8 时將 Serial + CMS、ParNew + Serial Old这两个组合声明为废弃(JEP 173),并在 JDK 9 中完全取消了这些组合的支持(JEP214),即移除。
- (绿色虚线)JDK 14中,弃用 Parallel Scavenge 和 Serial Old GC 组合(JEP 366 )
- (蓝色虚线)JDK 14中,删除 CMS 垃圾回收器 (JEP 363)
搭配使用的场景:
- java8 默认使用:Parallel Scavenge GC + PS MarkSweep(Serial Old GC)
- java9 默认使用:G1
- client模式、单CPU等硬件较差:Serial GC + Serial Old GC
- 追求高吞吐量:ParNew GC + CMS GC(Serial Old GC备用)
- java 14 之后只剩下 Serial GC + Serial Old GC、Parallel Scavenge GC + Parallel Old GC 和 G1 这三种组合。
可以执行下面命令查看当前虚拟机的垃圾回收器类型
2、Serial GC 和 Serial Old GC
Serial 收集器是最基本、历史最悠久的垃圾收集器了。JDK1.3 之前回收新生代唯一的选择。Serial 收集器作为 HotSpot 中 client 模式下的默认新生代垃圾收集器。Serial 收集器采用复制算法、串行回收和 "Stop-The-World" 机制的方式执行内存回收。
除了年轻代之外,Serial 收集器还提供用于执行老年代垃圾收集的 Serial Old 收集器。Serial Old 收集器同样也采用了串行回收和 "Stop-The-World" 机制,只不过内存回收算法使用的是标记-压缩算法。
Serial Old 在 Server 模式下主要有两个用途:
- 与新生代的 Parallel Scavenge 配合使用。
- 作为老年代 CMS 收集器的后备垃圾收集方案。
JVM 参数:
-XX:+UseSerialGC
同时设置新生代收集器为 Serial GC,老年代收集器为 Serial Old GC。
优势:简单而高效(与其他收集器的单线程比),对于限定单个 CPU 的环境来说,Serial 收集器由于没有线程交互的开销,专心做垃圾收集自然可以获得最高的单线程收集效率。在用户的桌面应用场景中,分配给虚拟机管理的内存一般不会很大,收集几十兆甚至一两百兆的新生代(仅仅是新生代使用的内存,桌面应用基本不会再大了),停顿时间完全可以控制在几十毫秒最多一百毫秒以内,只要不频繁发生,这点停顿时间可以接收。
适用场景:
- 运行在 Client 模式下的虚拟机(客户端)。
3、ParNew GC
ParNew 收集器就是 Serial 收集器的多线程版本,它也是一个新生代收集器。除了使用多线程进行垃圾收集外,其余行为包括 Serial 收集器可用的所有控制参数、收集算法(复制算法)、Stop The World、对象分配规则、回收策略等与Serial收集器完全相同,两者共用了相当多的代码。
ParNew 是很多 JVM 运行在 Server 模式下新生代的默认垃圾收集器。
JVM 参数:
-XX:+UseParNewGC
设置新生代收集器为 ParNew GC
-XX:ParallelGCThreads
设置并行收集线程数

由于ParNew收集器是基于并行回收,那么是否可以断定 ParNew 收集器的回收效率在任何场景下都会比 Serial 收集器更高效?
- ParNew 收集器运行在多CPU的环境下,由于可以充分利用多CPU、多核心等物理硬件资源优势,可以更快速地完成垃圾收集,提升程序的吞吐量。
- 但是在单个CPU的环境下,ParNew收集器不比Serial 收集器更高效。虽然Serial收集器是基于串行回收,但是由于CPU不需要频繁地做任务切换,因此可以有效避免多线程交互过程中产生的一些额外开销。
此外新生代收集器除 Serial GC 外,目前只有 ParNew GC 能与 CMS 收集器配合工作。
4、Parallel Scavenge GC + Parallel Old GC
HotSpot 的年轻代中除了拥有 ParNew 收集器是基于并行回收的以外,Parallel Scavenge 收集器同样也采用了复制算法、并行回收和 ”Stop the World” 机制。
那么 ParNew 收集器和 Parallel Scavenge 收集器的区别是什么?
- 和 ParNew 收集器不同,Parallel Scavenge 收集器的目标则是达到一个可控制的吞吐量(Throughput),也被称为吞吐量优先的垃圾收集器。高吞吐量则可以高效率地利用 CPU 时间,尽快完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务。因此,常见在服务器环境中使用。例如,那些执行批量处理、订单处理、工资支付、科学计算的应用程序。
- 自适应调节策略也是 Parallel Scavenge 与 ParNew 一个重要区别。
Parallel Old 收集器类似于 Parallel Scavenge 收集器,但是用于收集老年代的垃圾,采用了标记-压缩算法,但同样也是基于并行回收和 ”Stop-the-World” 机制。
JVM 参数
-XX:+UseParallelGC
设置新生代回收器为 Parallel Scanvenge GC,老年代回收器为 PS MarkSweep(Serial Old GC)。
-XX:+UserParallelOldGC
设置新生代回收器为 Parallel Scanvenge GC,老年代回收器为 Parallel Old GC。
-XX:ParallelGCThreads
设置年轻代并行收集器的线程数。一般地,最好与CPU数量相等,以避免过多的线程数影响垃圾收集性能。在默认情况下,当CPU 数量小于8个, ParallelGCThreads 的值等于CPU 数量。当CPU数量大于8个,ParallelGCThreads 的值等于3+[5*CPU_Count]/8] 。
-XX:MaxGCPauseMillis
设置垃圾收集器最大停顿时间(即STW的时间)。单位是毫秒。为了尽可能地把停顿时间控制在MaxGCPauseMills以内,收集器在工作时会调整Java堆大小或者其他一些参数。对于用户来讲,停顿时间越短体验越好。但是在服务器端,我们注重高并发,整体的吞吐量。所以服务器端适合Parallel,进行控制。该参数使用需谨慎。
-XX:GCTimeRatio
垃圾收集时间占总时间的比例(= 1 / (N + 1))。用于衡量吞吐量的大小。取值范围(0,100)。默认值99,也就是垃圾回收时间不超过1%。与前一个-XX:MaxGCPauseMillis 参数有一定矛盾性。暂停时间越长,Radio参数就容易超过设定的比例。
-XX:+UseAdaptiveSizePolicy
设置Parallel Scavenge收集器具有自适应调节策略。在这种模式下,年轻代的大小、Eden和Survivor的比例、晋升老年代的对象年龄等参数会被自动调整,已达到在堆大小、吞吐量和停顿时间之间的平衡点。在手动调优比较困难的场合,可以直接使用这种自适应的方式,仅指定虚拟机的最大堆、目标的吞吐量(GCTimeRatio)和停顿时间(MaxGCPauseMills),让虚拟机自己完成调优工作。

在程序吞吐量优先的应用场景中, Parallel 收集器和 Parallel Old 收集器的组合,在 Server 模式下的内存回收性能很不错。在 Java8 中,默认是 Parallel Scavenge GC + PS MarkSweep(Serial Old GC) 的组合。
注意:
- Parallel Scavenge 收集器有时候会使用 PS 前缀,即命名为 PS Scavenge,本身包含了老年代收集器,被命名为 PS MarkSweep。但由于 PS MarkSweep 与 Serial Old 实现非常接近,基本是使用同一份代码,因此官方的许多资料都直接以 Serial Old 代替 PS MarkSweep 进行讲解。
- 在 JDK 8 及更高版本,如果只设置
-XX:+UseParallelGC
,JVM 会 自动启用-XX:+UseParallelOldGC
,即老年代也会使用并行收集。而在 JDK 7 或更早版本,-XX:+UseParallelGC
不会自动启用老年代并行,需要显式设置-XX:+UseParallelOldGC
。可以通过jcmd
或jinfo
查看是否启用-XX:+UseParallelOldGC
。
5、CMS GC
在 JDK 1.5 时期,HotSpot 推出了一款在强交互应用中几乎可认为有划时代意义的垃圾收集器:CMS (Concurrent-Mark-Sweep)收集器。这款收集器是HotSpot虚拟机中第一款真正意义上的并发收集器,它第一次实现了让垃圾收集线程与用户线程同时工作。
CMS收集器的关注点是尽可能缩短垃圾收集时用户线程的停顿时间。停顿时间越短(低延迟)就越适合与用户交互的程序,良好的响应速度能提升用户体验。目前很大一部分的Java应用集中在互联网站或者B/S系统的服务端上,这类应用尤其重视服务的响应速度,希望系统停顿时间最短,以给用户带来较好的体验。CMS收集器就非常符合这类应用的需求。
不幸的是,CMS 作为老年代的收集器,却无法与 JDK 1.4 中已经存在的新生代收集器 Parallel Scavenge 配合工作,所以在 JDK 1.5 中使用 CMS 来收集老年代的时候,新生代只能选择 ParNew 或者 Serial 收集器中的一个。
在 G1 出现之前,CMS 使用还是非常广泛的。一直到今天,仍然有很多系统使用 CMS GC。
JVM 参数:
-XX:+UseConcMarkSweepGC
设置老年代为 CMS GC,同时自动打开-XX:+UseParNewGC
,设置新生代为ParNew GC
-XX:+UseCMSCompactAtFullCollection
用于指定在执行完Full GC后对内存空间进行压缩整理,以此避免内存碎片的产生,默认开启。不过由于内存压缩整理过程无法并发执行,所带来的问题就是停顿时间变得更长了。
-XX:CMSFullGCsBeforeCompaction
设置在执行多少次Full GC后对内存空间进行压缩整理。
-XX:ParallelCMSThreads
设置 CMS 的线程数,默认为(ParallelGCThreads + 3)/4
-XX:CMSInitiatingOccupancyFraction
设置堆内存使用率的阈值,一旦达到该阈值,便开始进行回收。JDK5 及以前版本的默认值为68,即当老年代的空间使用率达到 68% 时,会执行一次 CMS 回收;JDK6及以上版本默认值为92%。
- 如果内存增长缓慢,则可以设置一个稍大的值,大的阈值可以有效降低 CMS 的触发频率,减少老年代回收的次数可以较为明显地改善应用程序性能。反之,如果应用程序内存使用率增长很快,则应该降低这个阈值,以避免频繁触发老年代串行收集器。因此通过该选项便可以有效降低Full GC 的执行次数。
-XX:+UseCMSInitiatingOccupancyOnly
关闭动态检查,动态检查是指 CMS 会根据历史记录,预测内存空间还剩多少时触发 CMS GC,一般和-XX:CMSInitiatingOccupancyFraction
搭配使用.
-XX:+CMSScavengeBeforeRemark
在重新标记之前执行一次 Minor GC。

CMS GC的回收过程
CMS的垃圾收集算法本质上仍然是采用标记-清除算法,并且也会 ”Stop-the-World”。但是整个过程比之前的收集器要复杂,主要分为五个阶段(七个步骤):
- 初始标记阶段(Initial-Mark):仅标记 GC Roots 直接可达的对象(如栈帧中的局部变量、静态变量等)以及新生代晋升到老年代的对象。Java7 单线程,Java8 多线程,STW,速度非常快。

- 并发标记阶段(Concurrent Mark):从第一阶段扫描出来的初始标记对象开始遍历全部老年代对象,在执行阶段由于新生代晋升到老年代等原因,导致部分老年代引用关系发生变化,把受影响的老年代的对象所在的 Card 标记为 Dirty,和用户线程并发执行,耗时较长。

- 并发预清理阶段(Concurrent-Preclean):1)扫描 Dirty Card,并标记被 Dirty 对象直接或间接引用的对象,然后清除 Card 标识。2)处理新生代对老年代的引用(如 Eden 区新分配的对象引用了老年代对象)。并发预清理阶段的目的是为了让重新标记阶段的 STW 尽可能短,和用户线程并发执行,可通过
CMSPrecleaningEnabled
关闭。

如上所示,3 的引用发生了变化,将 6 标记为存活

- 可中断预清理(Concurrent-Abortable-Preclean):有一些老年代对象的存活是因为被新生代引用,为了尽快确定这些老年代对象可以尽量减少新生代的对象数量,可以先进行一次 Minor GC。可中断预清理阶段的目的是为了让重新标记阶段的 STW 尽可能短,和用户线程并发执行,可设置参数不执行。
- 重新标记阶段(Remark):遍历整个堆标记老年代存活对象,包括遍历新生代对象、GC Roots、老年代的 Dirty Card 对象并重新标记。STW,比初始标记耗时稍微长一点,远比并发标记时间短。
- 并发清除阶段(Concurrent-Sweep):清理未被标记的垃圾对象(采用标记-清除算法,不整理内存),和用户线程并发执行。
- 并发重置阶段(Concurrent-Reset):重置 CMS 内部数据结构,为下次回收做准备。
尽管 CMS 收集器采用的是并发回收(非独占式),但是在初始化标记和重新标记这两个阶段中仍然需要执行“Stop-the-World”。这点很重要,面试高频题。由于最耗费时间的并发标记与并发清除阶段都不需要暂停工作,所以整体的回收是低停顿的。
CMS GC的问题
1、内存碎片问题
CMS 收集器的垃圾收集算法采用的是标记—清除算法,这意味着每次执行完内存回收后,由于被执行内存回收的无用对象所占用的内存空间极有可能是不连续的一些内存块,不可避免地将会产生一些内存碎片。那么 CMS 在为新对象分配内存空间时,将无法使用指针碰撞(Bump the Pointer)技术,而只能够选择空闲列表(Free List)执行内存分配。
既然 Mark Sweep 会造成内存碎片,那么为什么不把算法换成 Mark Compact 呢?原因是:当并发清除的时候,用 Compact 整理内存的话,原来的用户线程使用的内存还怎么用呢?要保证用户线程能继续执行,前提的它运行的资源不受影响嘛。Mark-Compact 更适合 “Stop the World” 这种场景下使用。
解决方案:设置参数
-XX:CMSFullGCsBeforeCompaction=n
,该参数的作用是让 CMS 在进行 n 次 Full GC(标记清除)的时候进行一次标记整理算法。2、Promotion Failed(晋升失败) 和 Concurrent Mode Failure(并发模式失败)问题
Promotion Failed 是指在进行 Minor GC 时,Survivor 区空间不足,需要将对象晋升到老年代,但老年代也无法容纳这些对象的情况。这种情况通常发生在以下两种场景:
- 老年代空间不足:老年代剩余连续空间不足以容纳从新生代晋升的对象。
- 内存碎片问题:虽然老年代总空间足够,但由于CMS使用标记-清除算法产生内存碎片,无法找到足够的连续空间存放晋升的大对象。
Promotion Failed 在 GC 日志中通常表现如下:
Concurrent Mode Failure 是 CMS 特有的问题,发生在 CMS 并发标记和并发清理阶段。当老年代空间不足以容纳应用新产生的对象(可能是新生代晋升的对象或直接分配的大对象)时,就会抛出此错误。这种情况通常发生在以下场景:
- CMS 触发太晚。由于在垃圾收集阶段用户线程没有中断,应用线程仍然会把对象放入老年代,所以 CMS 收集器不能像其他收集器那样等到老年代几乎完全被填满了再进行收集,而是当堆内存使用率达到某一阈值时,便开始进行回收。如果 CMS 回收触发太晚,预留的内存无法满足程序需要,就会报错。
- 内存碎片问题。老年代内存碎片过多,无法分配大对象
- 对象分配速率超过 CMS 回收速率。有可能是年轻代晋升到老年代的速度过快,也有可能是 CMS 的回收速率太低。
出现 Concurrent Mode Failure 异常之后,JVM 会使用备用的 Searial Old 垃圾回收器对老年代进行单线程垃圾回收,会导致 STW 的时间非常长。应该尽量避免该异常出现。
常见原因和对应的解决方案如下:
原因 | 问题描述 | 解决方案 |
CMS触发太晚 | CMS的 backgroup GC 触发时机太晚,会导致在 backgroup GC 完成前,年老代剩余可用空间放不下新提升上来的或者直接在年老代分配的对象,从而触发 Full GC 并中断并发过程。 | 设置参数 -XX:+UseCMSInitiatingOccupancyOnly -XX:CMSInitiatingOccupancyFraction=60 -XX:CMSWaitDuration=1500 ,调低触发 CMS GC执行的阀值,使其更早更快地开始 CMS GC。CMSInitiatingOccupancyFraction 默认值是92%,CMS backgroup GC 扫描间隔默认是:2000
但注意这里并不是调的越小越好,越小年老代GC频率会越高,整体业务暂停的时间有可能会更长。另外,某些情况下,该参数设置太小导致年老代空间触发backgroup GC前可用的空间根本放不下所有晋升上来的长生命周期的对象,从而导致JVM一直不停地做年老代GC,严重影响业务性能。 |
老年代空间碎片太多 | CMS收集器采用的标记-清除算法,并不对年老代进行回收后的内存整理(虽然GC后会进行一些连续空间的合并)。因此多次GC后会存在较多的空间碎片。所以可能导致年老代剩余空间足够,但在大对象提升时由于没有连续的可用空间导致提升失败。 | 通过 -XX:+UseCMSCompactAtFullCollection -XX:CMSFullGCsBeforeCompaction=5 来让JVM在多少次 Full GC 后进行年老代空间的碎片整理。但是这两个参数起到的是”病后用药“的作用,前提是已经发生了Full GC才触发(所以有一些比较曲线救国的办法就是在凌晨低峰期间:代码中定时调用 System.gc 来触发一次 Full GC 从而进行年老代的空间整理)。
如果碎片问题确实比较严重,可以考虑改用G1垃圾回收器(G1每次GC都会对region进行整理)。 |
年轻代晋升速度过快 | 不管是promotion failed还是concurrent mode failure,都是由于提升时年老代可用空间不够导致的,因此提升速度过快是导致这些问题的直接原因。具体会导致提升过快的非业务原因有几点:
1、年轻代对象晋升年龄阈值太小。
2、eden区太小,触发年轻代GC太容易。
3、survivor空间溢出(未满年龄的对象提前晋升,参考前面的Desired survivor size的计算)。
4、业务中大对象较多,超过阈值直接在年老代中分配。 | 1、调整 -XX:MaxTenuringThreshold (默认15),提高年轻代晋升年龄。注意:这里并不代表真正达到这个年龄才晋升,但JVM计算一个desired survivor size大小,survivor区对象如果累计到某一个age值的对象大小大于desired survivor size,下次晋升时大于等于该年龄的对象就会被提前promote到年老代,这里这个age值就是动态计算出来的。
2、通过 -XX:SurvivorRatio=N 调整 eden 区和 survior 可用区的比例。默认比例是(8:1),survior区分s0和s1两部分,同一时刻只有一个区可用。所以实际可用大小为xmn的1/10。一般可以通过扩大eden区来减少年轻代GC次数,让年轻代对象到达触发年龄的速度慢一点。
3、调整动态年龄计算比例。survivor空间溢出的直接原因是计算的Desired survivor size太小,导致很多未满年龄的对象提前晋升到年老代,可以通过降低 -XX:TargetSurvivorRatio=N (默认50,就是一个s0或者s1的一半),尽量避免提前晋升的溢出问题。
4、针对大对象,可以通过 -XX:PretenureSizeThreshold 来设置直接在年老代分配的对象阈值,默认是0,即:由JVM动态决定(PS:这个参数尽量不要用,除非对自己的业务细节访问模型很清楚)。
如果以上调整都没办法彻底解决GC问题,那么应该考虑在系统内存可用范围内扩大整个heap的大小了。 |
CMS GC回收处理效率太低 | CMS是一个并发的垃圾回收器,用于CMS各个阶段的GC线程数默认值是: ConcGCThreads = (ParallelGCThreads+3)/4 。
而这里 ParallelGCThreads 表示的是GC并行时使用的线程数。比如如果新生代使用ParNew,那么ParallelGCThreads也就是新生代GC线程数。默认情况下,当CPU数量小于8时,ParallelGCThreads的值就是CPU的数量,当CPU数量大于8时,ParallelGCThreads的值等于3+5cpuCount/8。
例如,在32核机器上,新生代并行GC线程数为 3 + 532/8 = 23,所以对应的CMS的并发线程数为 (23 +3) / 4 = 6。、 | 通过参数 -XX:ParallelGCThreads=23 -XX:ConcGCThreads=6 来分别增加年轻代GC并行处理和年老代GC并发处理的能力。但这里也并不是越大越好,因为CMS的很多阶段都是和业务线程并发进行的,如果用于GC的线程数太多也会更多抢占业务线程的处理时间片,从而影响业务性能,所以这里需要进行实际场景的验证测试。 |
3、remark 阶段停顿时间长的问题
解决方案:设置参数
-XX:+CMSScavengeBeforeRemark
,该参数的作用是在执行 remark 操作之前先做一次 Minor GC。目的在于减少年轻代对老年代的无效引用,降低 remark 时的开销。6、G1 GC
G1(Garbage-First)是一款面向服务端应用的垃圾收集器,主要针对配备多核 CPU 及大容量内存的机器,以极高概率满足 GC 停顿时间的同时,还兼具高吞吐量的性能特征。在 JDK 1.7 版本正式启用,移除了 Experimental 的标识,是 JDK 9 以后的默认垃圾回收器,取代了CMS 回收器以及 Parallel + Parallel Old 组合。被 Oracle官方称为 “全功能的垃圾收集器”,与此同时,CMS已经在 JDK 9 中被标记为废弃(deprecated)。G1 GC 在 JDK 1.8 中还不是默认的垃圾回收器,需要使用
-XX:+UseG1GC
来启用。与其他 GC 收集器相比,G1使用了全新的分区算法,其特点如下所示:
- 并行 + 并发。
- 并行性:G1 在回收期间,可以有多个 GC 线程同时工作,有效利用多核计算能力。此时用户线程 STW。
- 并发性:G1 拥有与应用程序交替执行的能力,部分工作可以和应用程序同时执行,因此,一般来说,不会在整个回收阶段发生完全阻塞应用程序的情况
- 全新的分代概念。从分代上看,G1 依然属于分代型垃圾回收器。但不要求各代都是连续逻辑空间,将堆空间分为多个 Region(默认约 2048 个),每个 Region 都可能是 Eden、Survivor、Old、Humongous 区其中的一种。Region 的角色可以互换。例如 Eden 区被清空之后变成空白区域,加入空闲列表,后面可能会变成 Old 区用来存放老年代对象。
- 空间整合,避免内存碎片。G1 将内存划分为一个个的 Region,内存的回收是以 Region 作为基本单位的。Region之间是复制算法,但整体上实际可看作是标记-压缩(Mark-Compact)算法,两种算法都可以避免内存碎片。这种特性有利于程序长时间运行,分配大对象时不会因为无法找到连续内存空间而提前触发下一次 GC。尤其是当 Java 堆非常大的时候,G1 的优势更加明显。
- 可预测的停顿时间模型(软实时 soft real-time)。这是 G1 相对于 CMS 的另一大优势,G1 除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为 M 毫秒的时间片段内,消耗在垃圾收集上的时间不得超过 N 毫秒。G1 跟踪各个 Region 里面的垃圾堆积的价值大小(回收所获得的空间大小以及回收所需时间的经验值),在后台维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的 Region。保证了 G1 收集器在有限的时间内可以获取尽可能高的收集效率。
JVM 参数:
-XX+UseG1GC
设置垃圾回收器为 G1 GC
-XX:G1HeapRegionSize
设置每个 region 的大小,值是 2 的幂,1MB~32MB,默认是堆内存的 1/2000
-XX:MaxGCPauseMills
期望达到的最大 GC 停顿时间,会尽量满足不能保证一定达到,默认是 200ms
-XX:ParallelGCThread
并行执行即 STW 阶段的工作线程数,最多 8
-XX:ConcGCThreads
并发执行的线程数,一般为-XX:ParallelGCThread
的四分之一
-XX:InitiatingHeapOccupancyPercent
设置触发并发GC周期的堆占用率阈值,默认值是45%
-XX:G1MixedGCCountTarget
一次 GC 周期最多执行 Mixed GC 的次数,默认为 8。
-XX:G1HeapWastePercent
默认值 5%,在全局并发标记结束后能够统计出所有可被回收的垃圾占 Heap 的比例值,如果超过5%,那么就会触发之后的多轮 Mixed GC。这个参数可以控制 Mixed GC 触发的时机。
在介绍垃圾回收过程之前我们先来了解几个重要的概念。
Region

G1 将堆内存划分为多个大小相等的 Region(默认约 2048 个),一个 Region 有可能属于 Eden,Survivor、Old 区,但是一个 Region 只可能属于一个角色。图中的 E 表示该 region 属于 Eden 内存区域,S 表示属于 Survivor 内存区域,O 表示属于 Old 内存区域。图中空白的表示未使用的内存空间。
G1 垃圾收集器还增加了一种新的内存区域,叫做 Humongous 区,如图中的 H 块。主要用于存储大对象,如果对象大小超过 1.5 个 Region,就放到 H。设置 H 的原因: 对于堆中的大对象,默认直接会被分配到老年代,但是如果它是一个短期存在的大对象,就会对垃圾收集器造成负面影响。为了解决这个问题,G1 划分了一个 Humongous 区,它用来专门存放大对象。如果一个 H 区装不下一个大对象,那么 G1 会寻找连续的 H 区来存储。为了能找到连续的 H 区,有时候不得不启动 Full GC。G1 的大多数行为都把 H 区作为老年代的一部分来看待。
RSet(Remember Set)
Rset 是 G1 中每个 Region 都有的数据结构,记录哪些其他 Region 包含了指向当前 Region 中对象的引用。简单来说就是记录谁引用了我的对象,作用是在分析存活对象的时候,不需要扫描整个堆来找到谁引用了当前 Region 中的对象,只需要扫描对应的 Rset 即可,这样可以避免全局扫描。
RSet 通常会占用很大的空间,大约 5% 或者更高(最高可能20%)。不仅仅是空间方面,很多计算开销也是比较大的。

- 每个 Region 都会对应一个 Rset,Rset 记录了其他 Region 对当前 Region 的引用。。例如上面的 Region1、Region2、Region3 分别对应一个 Rset, Region2 的 Rset 中记录了 Region1 和 Region3 对当前 Region 的引用信息。
- Rset 需要保存的引用关系:
- Old Region → Young Region(老年代引用年轻代)。年轻代的 Region 的 RSet 只保存来自老年代的引用。这是因为年轻代的回收是针对所有年轻代 Region 的,没必要画蛇添足。所以说年轻代 Region 的 RSet 有可能是空的。
- Old Region → Old Region(老年代引用老年代)。老年代的 Region 的 RSet 也只会保存老年代对它的引用。这是因为老年代回收之前,会先对年轻代进行回收。这时,Eden 区变空了,而在回收过程中会扫描 Survivor 分区,所以也没必要保存来自年轻代的引用。
RSet 究竟是怎么辅助 GC 的呢?
- 在 Minor GC 的时候,只需要选定年轻代的 RSet 作为 GC ROOTs,这些 RSet 记录了
Old -> Young
的跨代引用,避免了扫描整个老年代。
- 在 Mixed GC 的时候,老年代中记录了
Old -> Old
的RSet,Young -> Old
的引用从 Survivor 区获取(老年代回收之前,会先对年轻代进行回收,存活的对象放在 Survivor 区),这样也不用扫描全部老年代。
所以 RSet 的引入大大减少了 GC 的工作量。
CSet(Collection Set)
CSet 是每次垃圾回收时被选定待回收的 Region 集合。G1 每次 GC 并不会回收所有垃圾对象,而是
- 根据 Region 的垃圾多少来判断与预估回收价值(指回收的垃圾与回收的 STW 时间的一个预估值),将一个或者多个 Region 放到 CSet。
- 对 Cset 的 Region 进行扫描分析。
- 在满足回收条件后,最后将这些 Region 中的存活对象压缩并复制到新的 Region 中,清空原来的 Region。
CSet 有两种类型:
fully-young generational mode
模式:该模式下 CSet 将只包含 Young Region 和 Survivor Region。G1 将调整 Young 的 Region 的数量来匹配软实时的目标。
partially-young mode
模式:该模式会选择所有的 Young Region、Survivor Region 和一部分的 Old Region。Old Region 的选择将依据在 Marking cycle phase 中对存活对象的计数。G1 选择存活对象最少的 Region 进行回收。
IHOP
IHOP(InitiatingHeapOccupancyPercent),缺省情况是 Java 堆内存的45%。当老年代的空间超过 45%,G1 会启动一次混合周期收集。
这也是 G1 和 CMS 之间较大的区别,G1 的百分比是相对于整个 Java 堆而言的,CMS 仅仅是针对老年代空间的占比。
为什么 G1 如此设计呢?因为 G1 没有固定物理上分割一块内存作为老年代,而是用了 Region 的思想,这些 Region 可能是 Eden,Survivor、Old 或者 H 区,所以获取针对老年代本身的占用百分比没有意义。
SATB(Snapshot At the Begging)
在说明 SATB 之前,我们先来了解一下三色标记法。
在三色标记法之前的算法叫 Mark-And-Sweep(标记清除)。这个算法会设置一个标志位来记录对象是否被使用。
- 最开始所有的标记位都是 0,如果发现对象是可达的就会置为 1,一步步下去就会呈现一个类似树状的结果。
- 等标记的步骤完成后,会将未被标记的对象统一清理,再次把所有的标记位设置成 0 方便下次清理。
这个算法最大的问题是 GC 执行期间需要把整个程序完全暂停,不能实现用户线程和 GC 线程并发执行。因为在不同阶段标记清扫法的标志位0和1有不同的含义,那么新增的对象无论标记为什么都有可能意外删除这个对象。对实时性要求高的系统来说,这种需要长时间挂起的标记清扫法是不可接受的。
三色标记法其实就是对标记-清除算法的改进版,用来解决标记-清除算法执行过程中 GC 时间过长,程序长时间挂起的问题。三色标记法将对象用三种颜色表示:
- 白色:对象没有被标记到,标记阶段结束后,会被当做垃圾回收掉。
- 灰色:对象被标记了,但是但该对象下的属性没有全被标记完。GC 需要从此对象中去寻找垃圾。
- 黑色:对象被标记了,且该对象下的属性也全部都被标记过了。这是程序所需要的对象。

三色标记法的标记过程:
- 在 GC 标记开始的时候,所有的对象均为白色。
- 从 GC Roots 触发,在将所有的 GC Roots 直接引用的对象标记为灰色集合。
- 从灰色集合中取出对象,将其引用的白色对象标记为灰色,自身标记为黑色
- 按照此步骤 3,直到没有灰色对象。
- 标记结束后,白色的对象为 GC Roots 不可达,进行垃圾回收。
三色标记法的问题在于,可能会产生漏标问题。

- 对象 A 被标记为了黑色,此时它所引用的两个对象 B、C 都在被标记的灰色阶段。
- 此时用户线程把
B->D
之间的的引用关系删除,并且在A->D
之间建立引用。
- 此时 B 对象依然未扫描结束,而 A 对象又已经被扫描过了,不会继续接着往下扫描了。因此 D 对象虽然是被引用的对象,但是因为仍然被当做垃圾回收掉。
当下面两个条件同时满足,会产生漏标问题:
- 有至少一个黑色对象在自己被标记之后指向了白色对象。
- 所有的灰色对象在自己引用扫描完成之前删除了对白色对象的引用。
要解决漏标的问题,只需要破坏这两个条件中的任意一种即可。漏标问题在 CMS 和 G1 收集器中有着不同的解决方案。
CMS 采用的是
增量更新(IncrementalUpdate)
算法。增量更新要破坏的是第一个条件。在并发标记阶段时如果一个白色对象被一个黑色对象引用时,会将黑色对象重新标记为灰色,让垃圾收集器在重新标记阶段重新扫描。可以简化理解为,黑色对象一旦新插入了指向白色对象的引用之后,它就变回灰色对象了。G1 采用的是
原始快照(SATB)
算法。原始快照要破坏的是第二个条件。当灰色对象要删除指向白色对象的引用关系时,就将这个要删除的引用记录下来,在并发扫描结束之后,再将这些记录过的引用关系中的灰色对象为根,重新扫描一次。可以简化理解为,当一个灰色对象取消了对白色对象的引用,那么这个白色对象被变灰。- 在开始标记的时候生成一个快照图标记存活对象。
- 在一个引用断开后(例如上面的 B 和 D 之间的引用),要将被断开的引用(D)推到 GC 的堆栈里,保证白色对象还能被 GC 线程扫描到(在write barrier 里把所有旧的引用所指向的对象都变成非白的)。
- 配合 Rset,去扫描哪些 Region 引用到当前的白色对象,若没有引用到当前对象,则回收。
两种漏标解决方案的对比:
- 增量更新算法关注的是引用的增加(
A->C
的引用) - 优点:避免浮动垃圾。
- 缺点:需要再次扫描被重新标记为灰色对象的所有引用,效率低。
- 原始快照算法关注的是引用的删除(
B->C
的引用) - 优点:效率非常高,无需扫描整个引用链
- 缺点:这个白色对象有可能并没有黑色对象去引用它,但是它还是被变灰了,就会导致它和它的引用,本来应该被垃圾回收掉,但是此次 GC 存活了下来,就是所谓的浮动垃圾。其实这样是比较可以忍受的,只是让它多存活了一次 GC 而已,浪费一点点空间,但是会比增量更新更省时间。
G1 GC的回收过程

G1 GC 是一个循环的过程,按照下面阶段进行垃圾回收:
第一阶段,Young GC。当 Eden 区满了,触发 Young GC,只回收 Eden 区和 Survivor 区。G1 会创建包含 Eden 区和 Survivor 区的 CSet,期间会 STW。

- 扫描根。根是指 static 变量指向的对象,正在执行的方法调用链条上的局部变量等。根引用连同 RSet 记录的外部引用作为扫描存活对象的入口。
- 更新 Rset。处理
dirty card queue
中的 card,更新 RSet。此阶段完成后,RSet 可以准确的反映老年代对所在的内存分段中对象的引用。
- 处理 RSet。识别被老年代对象指向的 Eden 中的的对象,这些被指向的 Eden 中的对象被认为是存活的对象。
- 复制对象。此阶段,对象树被遍历,Eden 区内存段中存活的对象会被复制到 Survivor 区中空的内存分段,Survivor 区内存段中存活的对象如果年龄未达阈值,年龄会加1,达到阈值会被复制到 Old 区中空的内存分段。如果 Survivor 空间不够,Eden 区中部分数据会直接晋升到老年代空间。
- 处理引用。处理 Soft,Weak,Phantom,Final,JNI Weak 等引用。最终 Eden 空间的数据为空,GC 停止工作,而目标内存中的对象都是连续存储的,没有碎片,所以复制过程可以达到内存整理的效果,减少碎片。
第二阶段,并发标记阶段。随着越来越多的对象晋升到老年代中,当老年代占比(相对于 Java 总堆而言)达到 IHOP 参数之后,那么 G1 就会触发并发标记阶段。作用是是为了找出老年代的存活对象,降低下一阶段 Mixed GC 的停顿时间。
- 初始标记阶段(Initial marking phase):扫描 GC Roots 直接可达对象。
这个阶段是 STW
,并且会触发一次 Young GC。
- 根扫描区域(Root region scanning phase):扫描 Survivor Region 直接可达的老年代对象,并标记被引用的对象,这个阶段是并发进行的,要在下一个 Young GC 开始之前结束。
- 并发标记阶段(Concurrent marking phase):标记整个堆的存活对象。该过程是并发进行的,但是可以被 Young GC 所打断。
- 在并发标记阶段,若发现区域对象中的所有对象都是垃圾,那这个区域会被立即回收。
- 并发标记过程中,会计算每个区域的对象活性(区域中存活对象的比例)。
- 并发阶段产生的新的引用(或者引用的更新)会被 SATB 的 write barrier 记录下来。
- 重新标记阶段(Remark phase):也叫 final marking phase。该阶段只需要扫描 SATB,处理在并发阶段产生的新的存活对象的引用,相当于修正上一次的标记结果。
这个阶段是 STW
。
- 独占清理阶段(Cleanup phase):计算各个区域的存活对象和 GC 回收比例,把完全没有存活对象的 Region 直接放到空闲列表中,并进行排序,识别可以混合回收的区域。该阶段还会重置RSet。
- 该阶段不会真的清除,而是为下阶段做铺垫。
- 该阶段在计算 Region 中存活对象的时候是 STW 的,而在重置 RSet 的时候是可以并发进行的。
- 并发清理阶段:识别并清理完全空闲的区域。
第三阶段,Mixed GC 阶段。并发标记阶段结束之后,Mixed GC 阶段就启动了。该算法并不是一个 Old GC,除了回收整个 Young Region,还会回收一部分的 Old Region。这里注意是一部分老年代,而不是全部老年代。

- 一个周期里的单次 STW 的 Mixed GC 和 Young GC 是类似的,唯一区别就是在混合收集过程中会包含一部分老年分区。也就是说 Miixed GC 的 CSet 会把一部分 Old Region 放到 Eden Region 和 Survivor Region 的后面一起进行回收。
- G1 GC 会进行多次 Mixed GC,直到收集到足够数量的老年代区域。
- Mixed GC 结束,本次 GC 周期就算完成了。GC 将恢复到 Young GC,开启下一轮 GC 周期。
非必要阶段,Full GC。当 G1 无法以足够快的速度回收内存时,例如在 Mixed GC 期间出现老年代被占用完的情况,会退化为串行 Full GC,JVM 会采用 Serial Old 收集器来收集整个 Heap。整个过程非常耗时,应该尽量避免 Full GC。可以使用下面方案:
- 加大内存。
- 提高 CPU 性能,加快 GC 回收速度,使对象增加速度赶不上回收速度。
- 降低进行 Mixed GC 触发的阈值,让 Mixed GC 提早发生(默认45%)。
G1 GC的适用场景
- 面向服务端应用,针对具有大内存、多处理器的机器。(在普通大小的堆里表现并不惊喜)
- 最主要的应用是需要低 GC 延迟,并具有大堆的应用程序提供解决方案;如:在堆大小约 6GB 或更大时,可预测的暂停时间可以低于 0.5 秒;(G1 通过每次只清理一部分而不是全部的 Region 的增量式清理来保证每次 GC 停顿时间不会过长)。
- 用来替换掉 JDK1.5 中的CMS收集器; 在下面的情况时,使用 G1 可能比 CMS 好:
- 超过 50% 的 Java 堆被活动数据占用
- 对象分配频率或年代提升频率变化很大
- GC停顿时间过长(长于0.5至1秒)
- HotSpot 垃圾收集器里,除了 G1 以外,其他的垃圾收集器使用内置的 JVM 线程执行 GC 的多线程操作,而 G1 GC 可以采用应用线程承担后台运行的 GC 工作,即当 JVM 的 GC 线程处理速度慢时,系统会调用应用程序线程帮助加速垃圾回收过程。
7、ZGC
ZGC(The Z Garbage Collector)是 JDK 11 中推出的一款低延迟垃圾回收器,最初在 JDK 11 中作为实验性功能引入,在 JDK 15 中成为正式功能。ZGC 是一款基于 Region 内存布局的,(暂时)不设分代的,使用了读屏障、染色指针和内存多重映射等技术来实现可并发的标记-压缩算法的,以低延迟为首要目标的一款垃圾收集器。在尽可能对吞吐量影响不大的前提下,实现在任意堆内存大小下都可以把垃圾收集的停顿时间限制在十毫秒以内的低延迟。
ZGC 的工作过程可以分为 4 个阶段:并发标记-并发预备重分配-并发重分配-并发重映射等。
ZGC 几乎在所有地方并发执行的,除了初始标记的是STW的。所以停顿时间几乎就耗费在初始标记上,这部分的实际时间是非常少的。
JVM 参数:
-XX:+UseZGC
:启用 ZGC
-XX:ConcGCThreads=<n>
:并发 GC 线程数
-XX:ParallelGCThreads=<n>
:并行 GC 线程数


在 ZGC 的强项停顿时间测试上,它毫不留情的将 Parallel、G1 拉开了两个数量级的差距。无论平均停顿、95%停顿、99%停顿、99.9%停顿,还是最大停顿时间,ZGC 都能毫不费劲控制在 10 毫秒以内。未来将在服务端、大内存、低延迟应用的首选垃圾收集器。
JDK14 新特性 JEP 364:ZGC 应用在 macOS上 JEP 365:ZGC 应用在Windows上。
- JDK 14 之前,ZGC 仅 Linux 才支持。
- 尽管许多使用 ZGC 的用户都使用类 Linux 的环境,但在 Windows 和 macOS 上,人们也需要 ZGC 进行开发部署和测试。许多桌面应用也可以从 ZGC 中受益。因此,ZGC 特性被移植到了 Windows和 macOS 上。
- 现在 macOS 或 Windows上也能使用 ZGC了,示例如下:
XX:+UnlockExperimentalVMOptions -XX:+UseZGC
ZGC 在 JDK15 达到 production-ready,JDK17 是第一个开始推出成熟的 ZGC 的长期支持的 ZGC 版本。
8、垃圾回收器设置
如果没有在应用启动时指定虚拟机类型,可以使用下面命令来查看当前 JDK 版本的默认垃圾回收器

也可以通过 jmap 命令查看堆信息详情的时, 在内存区域上会体现垃圾回收器类型
常用垃圾回收器设置参数如下
新生代 | 老年代 | JVM参数 |
Serial | Serial Old | -XX:+UseSerialGC |
Parallel Scavenge | Serial Old | -XX:+UseParallelGC |
Parallel Scavenge | Parallel Old | -XX:+UseParallelGC -XX:+UseParallelOldGC |
Parallel New | Serial Old | -XX:+UseParNewGC |
Parallel New | CMS | -XX:+UseParNewGC -XX:+UseConcMarkSweepGC |
G1 | -XX:+UseG1GC |
三、垃圾回收相关问题
1、什么时候会发生 Full GC
- 调用
System.gc()
。但调用后不一定立即发生 Full GC,由 JVM 控制 GC 的时机(可通过-XX:+DisableExplicitGC
禁用 )。
- 老年代的可用空间不足。
- 方法区空间不足时。
- 空间担保失败。通过 Minor GC 后进入老年代的平均大小大于老年代的可用内存。
- GC 晋升失败(Promotion Failed):由 Eden 区、From Survior 区向 To Survior 区复制时,对象大小大于 To Survior 区可用内存,则把该对象转存到老年代,且老年代的可用内存小于该对象大小时。
- Concurrent Mode Failure。如果老年代使用了 CMS 垃圾回收器,因为 CMS 垃圾回收器的垃圾回收线程和用户线程是并发执行的,在 CMS GC 的过程中,如果新生代 Survivor 空间放不下,需要放入老年代,而老年代也放不下,或者用户直接把对象放入老年代放不下,就会报 Concurrent Mode Failure。
- 执行
jmap -histo:live
或者jmap -dump:live
。
2、空间分配担保机制
空间分配担保机制(Space Allocation Guarantee Mechanism)是指在 Minor GC 前预先检查老年代是否有足够空间,从而决定是否允许进行 Minor GC 或需要直接触发Full GC。
空间担保机制主要解决以下问题:当新生代进行 Minor GC 时,如果存活对象太多而 Survivor 区无法容纳,这些对象需要晋升到老年代。但如果老年代空间也不足,就会导致晋升失败。
空间担保机制的过程:发生 Minor GC 之前,JVM 虚拟机会检查老年代最大可用的连续空间是否大于新生代所有空间总和。
- 如果大于,那么此次 Minor GC 是安全的。
- 如果小于,则 JVM 查看
-XX:HandlePromotionFailture
是否允许担保失败。 - 如果
HandlePromotionFailture=true
,那么会继续检查老年代最大可用连续空间是否大于历次晋升到老年代对象的平均大小。 - 如果大于,则尝试进行一次 Minor GC,但此次 Minor GC 仍然是有风险的。
- 如果小于,则改为进行一次 Full GC。
- 如果
HandlePromotionFailture=false
,则改为进行一次 Full GC。
为什么需要空间担保机制?
因为新生代采用复制收集算法,假如大量对象在 Minor GC 后仍然存活(最极端情况为内存回收后新生代中所有对象均存活),而 Survivor 空间是比较小的,这时就需要老年代进行分配担保,把 Survivor 无法容纳的对象放到老年代。老年代要进行空间分配担保,前提是老年代得有足够空间来容纳这些对象,但一共有多少对象在内存回收后存活下来是不可预知的,因此只好取之前每次垃圾回收后晋升到老年代的对象大小的平均值作为参考。使用这个平均值与老年代剩余空间进行比较,来决定是否进行 Full GC 来让老年代腾出更多空间。
3、动态年龄判断
为了能更好地适应不同程序的内存状况,虚拟机并不总是要求对象的年龄必须达到
MaxTenuringThreshold
才能晋升老年代。动态年龄判断规则是指:Minor GC 时,如果在 Survivor 区从年龄 0开始累加,当累加到某个年龄时,对象总大小超过了 Survivor 区的一半,年龄大于或等于该年龄的对象就可以直接进入老年代,无须等到 MaxTenuringThreshold
中要求的年龄。动态对象年龄判定的作用是当某年龄段对象较多时提前晋升,避免长期存活对象在 Survivor 区反复复制。
假设:
- Survivor 区大小 = 100MB
- 年龄分布:年龄1 = 30MB,年龄2 = 30MB,年龄3 = 20MB
计算:
- 年龄1(30MB) < 50MB(一半)
- 年龄1 + 年龄2(60MB) > 50MB
则年龄2 及以上的对象(年龄2和年龄3)都会被晋升到老年代。
JVM 源码如下:
相关参数:
- 大对象直接进入老年代。那多大的对象是大对象?这个阈值通过
-XX:PretenureSizeThreshold
参数来配置。
- 年龄大于阈值,进入老年代。这个阈值通过
-XX:MaxTenuringThreshold
来配置,默认是 15。
- 动态年龄判断涉及到一个值,就是 survivor 区域的一半,其实也不一定是一半,可以通过
-XX:TargetSurvivorRatio
来配置。
4、内存溢出和内存泄漏
内存溢出和内存泄漏的区别:
- 内存溢出:申请内存的时候没有足够的内存可用。
- 内存泄漏:对象不再被使用,但是垃圾收集器又不能回收这些对象。
内存泄漏的示例:

- 静态集合类。如 HashMap、LinkedList 等等。如果这些容器为静态的,那么它们的生命周期与 JVM 程序一致,则容器中的对象在程序结束之前将不能被释放,从而造成内存泄漏。简单而言,长生命周期的对象持有短生命周期对象的引用,尽管短生命周期的对象不再使用,但是因为长生命周期对象持有它的引用而导致不能被回收。
- 单例模式。和静态集合导致内存泄露的原因类似,因为单例的静态特性,它的生命周期和 JVM 的生命周期一样长,所以如果单例对象如果持有外部对象的引用,那么这个外部对象也不会被回收,那么就会造成内存泄漏。
- 内部类持有外部类。如果一个外部类的实例对象的方法返回了一个内部类的实例对象。这个内部类对象被长期引用了,即使那个外部类实例对象不再被使用,但由于内部类持有外部类的实例对象,这个外部类对象将不会被垃圾回收,这也会造成内存泄漏。
- 各种连接,如数据库连接、网络连接和 IO 连接等。在对数据库进行操作的过程中,首先需要建立与数据库的连接,当不再使用时,需要调用 close 方法来释放与数据库的连接。只有连接被关闭后,垃圾回收器才会回收对应的对象。否则,如果在访问数据库的过程中,对 Connection、Statement 或 ResultSet 不显性地关闭,将会造成大量的对象无法被回收,从而引起内存泄漏。
- 变量不合理的作用域。一般而言,一个变量的定义的作用范围大于其使用范围,很有可能会造成内存泄漏。另一方面,如果没有及时地把对象设置为 null,很有可能导致内存泄漏的发生。
- 如上面这个伪代码,通过 readFromNet 方法把接受的消息保存在变量 msg 中,然后调用 saveDB 方法把msg的内容保存到数据库中,此时 msg 已经就没用了,由于 msg 的生命周期与对象的生命周期相同,此时 msg 还不能回收,因此造成了内存泄漏。实际上这个 msg 变量可以放在 receiveMsg 方法内部,当方法使用完,那么 msg 的生命周期也就结束,此时就可以回收了。
- 还有一种方法,在使用完 msg 后,把 msg 设置为 null,这样垃圾回收器也会回收 msg 的内存空间。
- 改变哈希值。当一个对象被存储进 HashSet 集合中以后,就不能修改这个对象中的那些参与计算哈希值的字段了。否则,对象修改后的哈希值与最初存储进 HashSet 集合中时的哈希值就不同了,在这种情况下,即使在 contains 方法使用该对象的当前引用作为的参数去HashSet集合中检索对象,也将返回找不到对象的结果,这也会导致无法从HashSet集合中单独删除当前对象,造成内存泄漏。这也是 String 为什么被设置成了不可变类型,我们可以放心地把 String 存入 HashSet,或者把String 当做 HashMap 的 key 值。当我们想把自己定义的类保存到散列表的时候,需要保证对象的 hashCode 不可变。
示例
- 缓存泄漏。内存泄漏的另一个常见来源是缓存,一旦把对象引用放入到缓存中,就很容易遗忘。比如:之前项目在一次上线的时候,应用启动奇慢直到夯死,就是因为代码中会加载一个表中的数据到缓存(内存)中,测试环境只有几百条数据,但是生产环境有几百万的数据。对于这个问题,可以使用 WeakHashMap 代替缓存。此种 Map 的特点是,当除了自身有对 key 的引用外,此 key 没有其他引用那么此 map 会自动丢弃此值。
示例
程序运行结果:
上面代码和图示主要演示 WeakHashMap 如何自动释放缓存对象,当 init 函数执行完成后,局部变量字符串引用 weakd1,weakd2 都会消失,此时只有静态 map 中保存中对字符串对象的引用,可以看到,调用 gc 之后,HashMap 的没有被回收,而 WeakHashMap 里面的缓存被回收了。
- 监听器和其他回调。内存泄漏常见来源还有监听器和其他回调,如果客户端在你实现的 API 中注册回调,却没有显示的取消,那么就会积聚。需要确保回调立即被当作垃圾回收的最佳方法是只保存它的弱引用,例如将他们保存成为 WeakHashMap 中的键。
示例
上面这段代码的主要问题在 pop(),这里只做了指针的移动,但是引用未手动置空,所以是不会释放内存的。可以改成这样。
- Author:mcbilla
- URL:http://mcbilla.com/article/d156e3ea-9ba8-4de9-934a-6880e3a079f5
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!
Relate Posts