深入理解Java虚拟机--垃圾回收算法

时间:2023-01-02 08:46:16

       了解GC和内存分配算法目的:当需要排查各种内存溢出、内存泄漏问题时,当垃圾回收成为系统达到更高并发量的瓶颈时,就需要对此实施必要的监控和调节。

       垃圾回收之前最重要的工作——判断对象的死活:

       1.引用计数算法:给对象添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就减1;任何时刻计数器为0的对象就是不可能再被使用的。主流的java虚拟机里面没有选用这个算法来管理内存,主要原因是它很难解决对象之间相互循环引用的问题。 

       2.根搜索算法
       在主流的商用程序语言中(Java和C#,甚至包括前面提到的古老的Lisp),都是使用根搜索算法(GC Roots Tracing)定对象是否存活的。这个算法的基本思路就是通过一系列的名为"GC Roots"的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连(用图论的话来说就是从GC Roots到这个对象不可达)时,则证明此对象是不可用的。
       在Java 语言里,可作为GC Roots 的对象包括下面几种:

  •        虚拟机栈(栈帧中的本地变量表)中的引用的对象。
  •        方法区中的类静态属性引用的对象。
  •        方法区中的常量引用的对象。
  •        本地方法栈中JNI(即一般说的Native方法)的引用的对象。
       3.再谈引用         在jdk1.2之后,java对引用的概念进行了扩充,将引用分为强引用,软引用,弱引用,虚引用 4种。这四种引用强度依次逐渐减弱。
  •        强引用就是指在程序代码中普遍存在的,类似“Object obj = new Object()”这类的引用,只要强引用还存在,垃圾收集器永远不会回收。
  •        软引用用来描述一些还有用,但并非必需的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中并进行第二次回收。如果这次回收还是没有足够的内存,才回抛出内存溢出异常。SoftReference类来实现软引用
  •         弱引用也是用来描述非必须对象的。只能生存到下次垃圾回收之前。GC工作时,无论内存是否够用都会回收。WeakReference。
  •        虚引用也称为幽灵引用或者幻影引用,最弱的一种引用关系。一个对象是否有虚引用存在,完全不会对其生存时间产生影响,也无法通过虚引用来获取一个对象实例。设置虚引用的唯一目的就是希望在这个对象被收集器回收时收到一个系统通知。虚引用主要用来跟踪对象被垃圾回收器回收的活动。虚引用与软引用和弱引用的一个区别在于:虚引用必须和引用队列 (ReferenceQueue)联合使用。当垃圾回收器准备回收一个对象时,如果发现它还有虚引用,就会在回收对象的内存之前,把这个虚引用加入到与之关联的引用队列中。当你的虚引用所引用的对象已经执行完finalize函数的时候,就会把对象加到queue里面。你可以通过判断queue里面是不是有对象来判断你的对象是不是要被回收了,让你知道你的对象什么时候会被回收。
        4.生存还是死亡        要真正宣告一个对象死亡,至少要经历两次标记:        在根搜索算法中不可达的对象,并不是“非死不可”的:如果对象在进行根搜索后发现没有与GC Roots相连接的引用链,那么它将会第一次标记并且进行一次筛选,筛选的条件是次对象是否有必要执行finalize()方法。当对象没有覆盖finalize()方法,或者已经被调用过,虚拟机将这两种情况视为“没有必要执行”。
       如果这个对象有必要执行finalize()方法,那么这个对象被放置在一个名为F-Queue的队列之中,并在稍后由一条虚拟机执行。“执行”是指虚拟机会出发这个方法,但并不承诺等待它运行结束。原因是,如果一个对象finalize()执行缓慢甚至死循环,会导致其他对象永久处于等待状态。finalize()方法是对象逃脱死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模的标记,如果对象在finalize()中成功拯救自己——只要重新与引用链上的任何一个对象建立关联即可,譬如把自己(this)复制给某个类变量或对象的成员变量,那么在第二次标记时将被移除队列。自救的机会只有一次,因为一个对象的finalize()方法最多只会被系统自动调用一次。
       5.回收方法区
       方法区(也就是HotSpot虚拟机中的永久代)进行垃圾收集的性价比低,主要回收两部分内容:废弃常量和无用的类。回收废弃常量与回收java堆中的对象非常类似,即常量池中的变量没有引用。判定一个类是否是“无用的类”的条件相对苛刻许多,需要同时满足下面三个条件: 
       该类的所有实例都已经被回收
       加载该类的ClassLoader已经被回收
       该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法
       6.垃圾回收算法
  •        标记——清除算法:
       最基础的收集算法,分为“标记”和“清除”两个阶段,首先标记所有需要回收的对象,然后统一回收所有标记对象
       后续算法都是基于此思想并改进               主要缺点:一、效率低,二、空间浪费,标记清除之后会产生大量不连续的内存碎片,当需要分配较大对象时,不得不提前触发另一次垃圾回收。
  •        复制算法:
       为解决效率问题,提出复制的算法
       将内存一分为相等的两块,每次只使用一块。当这一块内存用光,就将还存活的对象复制到另外一块,然后再把已经使用过的空间一次清理掉。        优点:每次只针对其中一块进行内存回收,内存分配也不用考虑内存碎片等复杂情况,只要一点堆顶指针,按顺序分配内存即可。实现简单,运行高效。        缺点:内存缩小为原来的一半。        用于回收新生代,因为新生代对象对象98%是朝生夕死的,所以并不需要按1:1划分空间,而是将内存分为一块较大的Eden和两块较小的Survivor空间,每次使用Eden和其中的一块Survivor空间。如果另外一块Survivor没有足够的空间存放上一次新生代存活下来的对象,这些对象将会分配到老年代。
  • 标记——整理算法:
       复制算法在对象存活率较高时要多次执行复制操作,效率低,而且如果不想浪费50%空间,就要有额外空间进行担保,以应对极端情况。所有老年代不能使用复制算法。
       标记与之前一样,整理指的是让所有存活对象都移向一端,然后直接清理掉端边界以外的内存
  • 分代收集算法
       将内存按照对象存活周期的不同,划分为几块。
       新生代和老年代:新生代由于存活对象少,使用复制算法,老年代由于对象存活率高,无额外空间担保,使用“标记——清除”或“标记——整理”算法。