Java虚拟机垃圾收集器分析

1 、活动对象

l  追踪 root 对象算法: 深度追踪 root 对象,将 heap 中所有被引用到的 root 做标志,所有未被标志的对象视为非活动对象,所占用的空间视为非活动内存。

2 、常用算法

l  Copy 算法

1  方法:将内存分为两个区域( from space  to space )。所有的对象分配内存都分配到 from space 。在清理非活动对象阶段,把所有标志为活动的对象, copy  to space ,之后清楚 from space 空间。然后互换 from sapce  to space 的身份。既原先的 from space 变成 to sapce ,原先的 to space 变成 from space 。每次清理,重复上述过程。

2  优点: copy 算法不理会非活动对象, copy 数量仅仅取决为活动对象的数量。并且在 copy 的同时,整理了 heap 空间,即, to space 的空间使用始终是连续的,内存使用效率得到提高。

3  缺点:划分 from space  to space ,内存的使用率是 1  2 。一般在 Young Generation 中使用。

l  Compaction 算法

1  方法:在清理非活动对象阶段,删除非活动对象占用内存,并且把活动对象向 heap 的底部移动,直到所有的活动对象被移到 heap 的一侧。

2  优点:无须划分 from sapce  to space ,提高内存的使用率。并且 compaction 后的内存空间也是连续分配的。

3  缺点:该算法相对比较复杂。一般在 Tenured Generation 中使用

 

1、  内存划分

l  Young Generation

1  生命周期很短的对象,归为 young generation 。由于生命周期很短,这部分对象在 gc 的时候,很大部分的对象已经成为非活动对象。因此针对 young  generation 的对象,采用 copy 算法,只需要将少量的存活下来的对象 copy  to space 。存活的对象数量越少,那么copy 算法的效率越高。

2  young generation  gc 称为 minor gc 。经过数次 minor gc ,依旧存活的对象,将被移出 young generation ,移到 tenured generation

3  young generation 分为:

1  eden :每当对象创建的时候,总是被分配在这个区域

2  survivor1  copy 算法中的 from space

3  survivor2  copy 算法中的 to sapce (备注:其中 survivor1  survivor2 的身份在每次 minor gc 后被互换)

4  minor gc 的时候,会把 eden+survivor1(2) 的对象 copy  survivor2(1) 去。

l  Tenured Generation

1  生命周期较长的对象,归入到 tenured generation 。一般是经过多次 minor gc ,还 依旧存活的对象,将移入到 tenured generation 。(当然,在 minor gc 中如果存活的对象的超过 survivor 的容量,放不下的对象会直接移入到 tenured generation 

2  tenured generation  gc 称为 major gc ,就是通常说的 full gc 

3  采用 compactiion 算法。由于 tenured generaion 区域比较大,而且通常对象生命周期都比较常, compaction 需要一定时间。所以这部分的 gc 时间比较长。

4  minor gc 可能引发 full gc 。当 eden  from space 的空间大于 tenured generation 区的剩余空间时,会引发 full gc 。这是悲观算法,要确保 eden  from space 的对象如果都存活,必须有足够的 tenured generation 空间存放这些对象。

l  Permanet Generation

1  该区域比较稳定,主要用于存放 classloader 信息,比如类信息和 method 信息。

                    2 对于 spring hibernate 这些需要动态类型支持的框架,这个区域需要足够的空间。

 

算法补充:

 

基本回收算法

  1. 引用计数(Reference Counting)
    比较古老的回收算法。原理是此对象有一个引用,即增加一个计数,删除一个引用则减少一个计数。垃圾回收时,只用收集计数为0的对象。此算法最致命的是无法处理循环引用的问题。
  2. 标记-清除(Mark-Sweep)
    此算法执行分两阶段。第一阶段从引用根节点开始标记所有被引用的对象,第二阶段遍历整个堆,把未标记的对象清除。此算法需要暂停整个应用,同时,会产生内存碎片。
  3. 复制(Copying)
    此算法把内存空间划为两个相等的区域,每次只使用其中一个区域。垃圾回收时,遍历当前使用区域,把正在使用中的对象复制到另外 一个区域中。次算法每次只处理正在使用中的对象,因此复制成本比较小,同时复制过去以后还能进行相应的内存整理,不过出现“碎片”问题。当然,此算法的缺 点也是很明显的,就是需要两倍内存空间。
  4. 标记-整理(Mark-Compact)
    此算法结合了“标记-清除”和“复制”两个算法的优点。也是分两阶段,第一阶段从根节点开始标记所有被引用对象,第二阶段遍历 整个堆,把清除未标记对象并且把存活对象“压缩”到堆的其中一块,按顺序排放。此算法避免了“标记-清除”的碎片问题,同时也避免了“复制”算法的空间问 题。
  5. 增量收集(Incremental Collecting) 
    实施垃圾回收算法,即:在应用进行的同时进行垃圾回收。不知道什么原因JDK5.0中的收集器没有使用这种算法的。
  6. 分代(Generational Collecting)
    基于对对象生命周期分析后得出的垃圾回收算法。把对象分为年青代、年老代、持久代,对不同生命周期的对象使用不同的算法(上述方式中的一个)进行回收。现在的垃圾回收器(从J2SE1.2开始)都是使用此算法的。

二、垃圾回收器


目前的收集器主要有三种:串行收集器、并行收集器、并发收集器 。

  1. 串行收集器 

    使用单线程处理所有垃圾回收工作,因为无需多线程交互,所以效率比较高。但是,也无法使用多处理器的优势,所以此收集器适合单处理器机器。当然,此收集器也可以用在小数据量(100M 左右)情况下的多处理器机器上。可以使用-XX:+UseSerialGC 打开。
  2. 并行收集器
    1. 对年轻代进行并行垃圾回收,因此可以减少垃圾回收时间。一般在多线程多处理器机器上使用。使用-XX:+UseParallelGC .打开。并行收集器在J2SE5.0第六6更新上引入,在Java SE6.0中进行了增强--可以堆年老代进行并行收集。如果年老代不使用并发收集的话,是使用单线程进行垃圾回收 ,因此会制约扩展能力。使用-XX:+UseParallelOldGC 打开。
    2. 使用-XX:ParallelGCThreads=<N> 设置并行垃圾回收的线程数。此值可以设置与机器处理器数量相等 。
    3. 此收集器可以进行如下配置:
      • 最大垃圾回收暂停: 指定垃圾回收时的最长暂停时间,通过-XX:MaxGCPauseMillis=<N> 指定。<N>为毫秒.如果指定了此值的话,堆大小和垃圾回收相关参数会进行调整以达到指定值 。设定此值可能会减少应用的吞吐量。
      • 吞吐量: 吞吐量为垃圾回收时间与非垃圾回收时间的比值 ,通过-XX:GCTimeRatio=<N> 来设定,公式为1/(1+N) 。例如,-XX:GCTimeRatio=19时,表示5%的时间用于垃圾回收。默认情况为99,即1%的时间用于垃圾回收。
  3. 并发收集器
    可以保证大部分工作都并发进行(应用不停止),垃圾回收只暂停很少的时间,此收集器适合对响应时间要求比较高的中、大规模应用。使用-XX:+UseConcMarkSweepGC 打开。
    1. 并发收集器主要减少年老代的暂停时间,他在应用不停止的情况下使用独立的垃圾回收线程,跟踪可达对象。在每个年老代垃圾回收周期 中,在收集初期并发收集器会对整个应用进行简短的暂停,在收集中还会再暂停一次。第二次暂停会比第一次稍长,在此过程中多个线程同时进行垃圾回收工作。
    2. 并发收集器使用处理器换来短暂的停顿时间 。在一个N个处理器的系统上,并发收集部分使用K/N 个可用处理器进行回收,一般情况下1<=K<=N/4 。
    3. 在只有一个处理器的主机上使用并发收集器 ,设置为incremental mode 模式也可获得较短的停顿时间。
    4. 浮动垃圾 :由于在应用运行的同时进行垃圾回收,所以有些垃圾可能在垃圾回收进行完成时产生,这样就造成了“Floating Garbage”,这些垃圾需要在下次垃圾回收周期时才能回收掉。所以,并发收集器一般需要20% 的预留空间用于这些浮动垃圾。
    5. Concurrent Mode Failure :并发收集器在应用运行时进行收集,所以需要保证堆在垃圾回收的这段时间有足够的空间供程序使用,否则,垃圾回收还未完成,堆空间先满了。这种情况下将会发生“并发模式失败”,此时整个应用将会暂停,进行垃圾回收。
    6. 启动并发收集器 :因为并发收集在应用运行时进行收集,所以必须保证收集完成之前有足够的内存空间供程序使用,否则会出现“Concurrent Mode Failure”。通过设置-XX:CMSInitiatingOccupancyFraction=<N> 指定还有多少剩余堆时开始执行并发收集
  4. 小结
    • 串行处理器: 
      --适用情况:数据量比较小(100M左右);单处理器下并且对响应时间无要求的应用。
      --缺点:只能用于小型应用
    • 并行处理器: 
      --适用情况:“对吞吐量有高要求”,多CPU、对应用响应时间无要求的中、大型应用。举例:后台处理、科学计算。
      --缺点:应用响应时间可能较长
    • 并发处理器:
      --适用情况:“对响应时间有高要求”,多CPU、对应用响应时间有较高要求的中、大型应用。举例:Web服务器/应用服务器、电信交换、集成开发环境。
Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐