JVM HotSpot 浅析JVM的垃圾回收机制
目的:本文描述了Sun公司的HotSpot Java虚拟机的垃圾收集工作原理。以便为更多Java爱好者在设计,开发以及部署时带来更多便利和益处。摘要:JVM规范中要求任何实现JVM的实现必须要提供一个能够回收未被使用内存的机制。这个机制就是垃圾回收(GC-Garbage Collection)。然而垃圾回收机制设计的好坏将直接影响依赖其运行的java应用的性能(
·
目的:
摘要:
分代垃圾回收
HotSpot JVM使用分代垃圾回收的方式。这种垃圾回收方式并不是HotSpot JVM的首创,而是人们在实践中发现存在下面的两条规律并在很早的时候就提出来了。即:
1)大多数对象在创建后很短的时间内就会没有任何对象再使用它了,即未被其它对象引用。
2)大多数一直被使用的对象(老对象)很少引用新创建的对象。
对于Java应用来说这两条规律始终是存在的,也有人根据这些规律称其为“弱分代”。因为将java对象分为“年轻”对象和“老”对象时并没有一个非常明确的指标而是由JVM规范的实现者控制的(当然JVM也可以提供参数让具体的开发者设定)。在HotSpot JVM中将分配到的内存堆(Heap)分为两个物理区域,一个是“年轻”区,另一个是“老”区。在这里我将“年轻”的一代叫做“新生代”,而对应的将“老”的一代对象叫做“老生代”。
l 新生代:绝大多数新创建的对象存放于此,这个区域一般来说比较小而且垃圾收集的频率也比较高。因为许多对象在创建后很快就会“死”去,在每次的“新生代”垃圾收集后能够“幸存”的对象非常的少。使用在“新生代”的这种垃圾收集叫做次要垃圾收集(Minor Collection)。正是因为“新生代”的大小(较小,寻址时间很短)和其存放的对象的特点(寿命短,所以有很多垃圾,每次收集都能释放较大的内存空间)使得次要垃圾收集的效率非常高。见图1。
图1:分代垃圾回收
l 老生代:在“新生代”中生存了较长时间的对象将被提升为“老”对象并转移到“老生代”区。这个区域一般要大一些而且增长的速度相对于“新生代”要慢一些,所以负责“老生代”垃圾收集的主垃圾收集(Major Collection)的执行频率与次要垃圾收集比要低很多。主垃圾收集发生在“老生代”中的对象占用的存储空间达到一定的量值的时候。见图1。
*为方便起见,在下面的章节中将用次收集来替代“次要垃圾收集”,用主收集替代“主要垃圾收集”。
为了使次收集的收集时间尽可能的短,HotSpot JVM使用了一种叫做卡表(Card Table)的机制见图2,来避免在每次进行次收集的时候遍历整个“老生代”。
图2:HotSpot中的卡表
新生代的组成
图3:新生代组成
其中:
l Eden:绝大部分新创建的对象存放在此区域。为什么说绝大多数而不是所有的呢?原因是应用在创建一个非常大的对象的时候JVM会直接将其分配在老生代而非新生代。在每次完成次收集的时候Eden区域总是空的。
l 存活区:顾名思义在垃圾收集过程中没有被当作垃圾收集的对象将放在次区域中。也就是说这个区域中的对象至少经历了一次次收集。存放存活区的对象在被“提升”到老生代前还有机会被收集。存活区有一对,他们中的一个始终保持为空,另一个用于存放存活下来的对象。
图4:一次次收集
(即垃圾)。从图中可以看到在Eden区的绿色部分将被收集而幸存下来的对象(白色部分)将被移到没有被使用的存活区2。在存活区1中的绿色部分是也是不被使用的对象,这些对象也将被收集。而位于存活区1中的蓝色部分是尚被引用但是还不够“老”的这些对象也将移到到存活区2。存活区1中剩余的部分就是被引用且已经够“老”的对象,他们将被移到老生代区。
图5:完成一次次收集后
垃圾收集器
串行收集器:又叫做“标记-压缩”收集器。这种收集器在收集的时候要求JVM停止执行应用。所以人们戏称这种收集模式为Stop-the-World(停止一切)模式。在完成收集后JVM才继续执行应用(见图6)。
图6:串行收集
串行收集器首先将“老生代”中的仍然存活的对象进行标记并将这些对象压缩到“老生代”空间的前端。这样“老生代”的后端将变成一个连续的空间,以便从“新生代”中足够老的对象顺利的“提升”到“老生代”中(见图7,红色部分为垃圾对象)。对于大多数不要求有非常迅速响应(例如几秒钟)的场合,例如客户端程序,这种收集器还是能够胜任的。
图7:“老生代”的一次压缩
并行收集器:在目前实际的应用中多数的java程序都运行在具有很大物理内存和多个CPU的服务器上。在比较理想的情况下垃圾收集应该能够有效利用所有的CPU,而不是只用其中的一个且其他的CPU都处于空闲状态。为避免过多的垃圾收集以便提高系统的吞吐量(即处理能力),在服务器模式的环境下Sun的HotSopt JVM使用并行收集器进行垃圾回收。因为这种垃圾回收器的一个主要目标是提高吞吐量,所以也叫做吞吐量型的收集器。并行收集器的工作方式是在次收集(对应于“新生代”)中使用所有的CPU进行并行收集,在主收集(对应于“老生代”)中采用串行收集器(见图8)。虽然与串行收集器相比较主收集没有显著的改善(因为两者在“老生代”中都使用了相同的串行收集器),但是在次收集部分的效率得以大幅度的提高。进而提高的系统的吞吐量。
图8:并行收集
同步收集器(Mostly-Concurrent Collector):对于某些的应用程序来说响应速度要远比吞吐量重要。同时收集器就是为低延时而设计的一种收集器。在已经介绍的Stop-the-World(停止一切)的收集模式中,当垃圾收集没有结束前对于外部的请求是不会进行响应的,直到收集完毕应用才会继续响应请求。这对于次搜集来说一般来说停顿时间不是很长(因为次收集往往需要很短的时间),但对于主收集来说,即使不是很频繁也会导致应用较长时间的停顿,尤其是在JVM堆分配的比较大的时候就更明显了。为了解决这种情况Sun JVM引入了同步收集器的方式。这种方式也叫做同步标记-清楚(CMS)或者还可以叫做“低延迟”收集器。图9展示了其工作原理。
图9:同步收集器
同步收集器以一个短暂的停顿开始,在这个短暂的停顿中将对那些能够迅速确定不是垃圾的对象进行标记。紧接着将进入同步标记阶段,在这个阶段中同步收集器对被使用的对象进一步进行标记,而应用也同时运行。应用在运行的过程中可能改变了对某些对象的引用,这使得同步标记阶段中并不能保证所有的被引用对象进行了标记,也导致了必须需要进行的第三个阶段-“再标记”。在再标记阶段中将会使应用进入第二个暂停,利用这个暂停时间同步收集器将完成对所有对象的标记。可以看出在再标记的过程中使用了并行的方式,所以这部分标记的对象的数量要比在初始阶段中标记完成的多。在最后一个阶段同步收集器将会把前几个阶段中标记出来的“老生代”中的垃圾对象进行清除。但是不会将被引用的对象放在一个连续的空间中(见图10,橙色为垃圾对象,绿色为收集后的空闲空间)。可以看出“老生代”中的可用空间并不是连续的,这个会导致将为提升到“老生代”的对象分配空间时需要工多的时间和资源。
图10:“老生代”中的同步清除
与串行收集器和并行收集器相比较同步收集器会有下面几个特点。
1)要求分配到的堆大;
2)对不连续空间的使用效率低;
3)在某些情况下能够显著缩短主收集使应用停顿的时间。
附录A:参考文献
JVM Specification第二版
http://java.sun.com/docs/books/vmspec/2nd-edition/html/VMSpecTOC.doc.html
转载:http://hi.baidu.com/%D2%BB%B7%BD%C1%EC%D6%F7/blog/item/2dae83d447b0e6cf50da4b21
更多推荐
已为社区贡献1条内容
所有评论(0)