【Java】JVM入门解析(三)
堆概述1)一个JVM实例只存在一个堆内存,堆也是Java内存管理的核心区域2)Java堆区在JVM启动的时候即被创建,其空间大小也就确定了,是JVM管理的最大一块内存空间(堆内存大小是可以调节的)3)《Java虚拟机规范》规定,堆可以处于物理上不连续的内存空间中,但在逻辑上它应该被视为连续的4)所有的线程共享Java堆,在这里还可以划分线程私有的缓冲区(Thread Local Allocatio
(图片来源于网络,侵删)
堆
概述
- 1)一个JVM实例只存在一个堆内存,堆也是Java内存管理的核心区域
- 2)Java堆区在JVM启动的时候即被创建,其空间大小也就确定了,是JVM管理的最大一块内存空间(堆内存大小是可以调节的)
- 3)《Java虚拟机规范》规定,堆可以处于物理上不连续的内存空间中,但在逻辑上它应该被视为连续的
- 4)所有的线程共享Java堆,在这里还可以划分线程私有的缓冲区(Thread Local Allocation Buffer,TLAB)
- 5)数组和对象可能永远不会存储在堆上,因为栈帧中保存引用,这个引用指向对象或数组在堆中的位置
- 6)在方法结束后,堆中的对象不会马上被移除,仅仅在垃圾收集的时候才会被移除
- 7)堆,是GC执行垃圾回收的重点区域
架构图
堆内存细分
Java7之前堆内存逻辑上分为
- 新生代
- 老年代
- 永久代
Java8之后堆内存逻辑上分为
- 新生代
- 老年代
- 元空间
注意:虽然堆内存中逻辑上分为新生代、老年代和元空间,但是物理上的堆只包括新生代、老年代,而元空间作为方法区的具体实现
堆空间大小
Java堆区用于存储Java对象实例,那么堆的大小在JVM启动时就已经定义好了,可以通过“-Xms”和“-Xmx”来进行设置
- “-Xms“ 用于表示堆区的起始内存,等价于 -XX:InitialHeapSize
- “-Xmx“ 用于表示堆区的最大内存,等价于 -XX:MaxHeapSize
一旦堆区中的内存大小超过 “-Xmx“所指定的最大内存时,将会抛出OutOfMemoryError
异常
通常会将 -Xms 和 -Xmx 两个参数配置相同的值,其目的是为了能够在Java垃圾回收机制清理完堆区后不需要重新分隔计算堆区的大小,从而提升性能
默认情况下,
初始化内存大小:物理电脑内存 / 64
最大的内存大小:物理电脑内存 / 4
新生代和老年代
Java堆区可细分为:新生代(YoungGen)和 老年代(OldGen)
其中新生代又可以划分为Eden区(伊甸园区)、Survivor0区(幸存者0区)和Survivo1区(幸存者1区)
下面的参数一般不会调整,使用默认即可:
配置新生代和老年代在堆结构的占比:
- 默认 -XX:NewRatio=2,表示新生代占1,老年代占2,即新生代占整个堆的 1/3
配置新生代中的Eden和两外两个Survivor空间占比:
- 默认比例是 8:1:1 可通过 -XX:SurvivoRatio 参数进行调整
几乎所有的Java对象都是在Eden区被new出来的
绝大部分的Java对象的销毁都在新生代进行了,即”朝生夕死“
可通过 -Xmn 设置新生代最大内存大小,如果使用了该参数,-XX:NewRatio 参数就失效了,一般使用默认值即可
对象分配过程
概述
为新对象分配内存时一个非常严谨和复杂的任务,所以过程很复杂,下面概述一下
- 1)new出来的对象先放在Eden区,此区有大小限制
- 2)当Eden区空间填满时,而程序又需要创建对象,此时会阻塞用户线程,JVM垃圾回收器将对Eden区进行垃圾回收(Minor GC),将Eden区中的不再被其他对象所引用的对象进行销毁,再加载新的对象放到Eden区
- 3)然后将Eden区中的剩余对象移动到Survivor0区
- 4)如果再次触发垃圾回收,对Eden区和from区(因为Survivor0和1区只能有一个区域能存放数据,所以将存放数据的称之为 from 区,不存放数据的称之为 to 区)进行垃圾回收,然后将Eden和from区中幸存下来的放到 to 区
- 5)后续不断触发垃圾回收,幸存的对象不断从 from 移动到 to 区,持续整个过程
- 6)对象在 from 和 to 区不断的移动之后,当次数达到15次时,就会从新生代移动到老年代了,这个次数可以通过 -XX:MaxTenuringThreshold 来进行设置
注意:有一些对象并不会需要经历15次移动才会移动到老年代,而是有可能创建对象时直接存储到了老年代,这样的原因比如有:该对象过大,新生代存储不了,直接就放在了老年代了
总结
- 关于垃圾回收:频繁的发生在新生代回收,很少在老年代回收,几乎不在永久代/元空间回收
通过下图更好的理解
GC概述
Minor GC、Major GC 和 Full GC
JVM在GC时,并非每次都对上面三个区域进行垃圾回收,大部分时候的回收的都是进行在新生代
针对HotSpot VM的实现,它里面的GC按照回收区域又分为两大类型:
- 部分收集:不是对整个Java堆的垃圾进行回收
- 新生代收集(Minor GC / Young GC):只是新生代的垃圾回收
- 老年代收集(Major GC / Old GC):只是老年代的垃圾回收
- 混合收集(Mixed GC):收集整个新生代以及部分老年代的垃圾回收
- 整堆收集(Full GC):针对整个Java堆和方法区进行垃圾回收
Minor GC触发时机:
- 1)当Eden空间不足时,就会触发Minor GC;Survivor空间不足不会触发GC
- 2)Minor GC是非常频繁的
- 3)会引发STW,暂停其他用户的线程,等垃圾回收结束,用户线程才会恢复运行
Major GC触发时机:
- 1)老年代空间不足时,会触发Major GC
- 2)Major GC速度比Minor GC慢10倍以上,STW的时间更长,所以尽量避免出现Major GC
- 3)如果Major GC后内存还不足,就会出现OOM
Full GC触发时机:
- 1)调用System.gc(),系统建议执行Full GC,但是不是必定执行
- 2)老年代空间不足
- 3)方法区空间不足
- 4)通过Minor GC后进入老年代的平均大小大于老年代的可用内存
- 5)由Eden区、from区向to区复制时,对象大小大于to区可用内存,则把该对象转存到老年代,且老年代的可用内存小于该对象大小
说明:Full GC一定要尽量避免触发!!!
分代思想
思考:为什么要把Java堆进行分代?有什么好处?
分代是为了优化GC性能!
如果没有分代,那么所有对象都在一个区域里面,每次GC时,都会扫描区域的所有对象,然后进行GC,这样是非常消费性能和时间的。而且经过前人大量的实践表明:70% - 99% 的对象都是临时对象,所以将Java堆划分为两个区域,一个专门用来存储那些朝生夕死的对象,一个用来存储非常持久的对象。即新生代和老年代,然后通过不同的GC方式,进行有效的垃圾回收,提高GC速度,提高性能!
内存分配策略
针对不同的年龄段的对象分配原则如下:
- 1)优先分配Eden
- 2)大对象直接分配到老年代(尽量避免程序中出现过多的大对象)
- 3)长期存活的对象分配到老年代
- 4)动态对象年龄判断(如果幸存者区中相同年龄的所有对象大小总和大于幸存者空间的一半,则年龄大于或等于该年龄的对象可以直接进入老年代,无需等到MaxTenuringThreshold中要求的年龄)
- 5)空间分配担保 (-XX:HandlePromotionFailure)
TLAB
什么是TLAB?
TLAB即Thread Local Allocation Buffer,Java对Eden区进行划分,为每个线程分配了一个私有的缓存区域
TLAB有什么用?
堆区是线程共享的,任何线程都可以访问堆区中的共享数据,由于对象实例的创建在JVM中非常频繁,因此在并发环境下从堆区中划分内存空间是线程不安全的,为了避免多个线程操作同一地址,需要使用加锁等机制,进而影响分配速度。所以引入TLAB,使用TLAB可以避免一系列的非线程安全问题,同时还能够提升内存分配的吞吐量,因此我们可以将这种内存分配方式称之为快速分配策略
可以通过 ”-XX:UseTLAB“ 设置是否开启TLAB空间
默认情况下,TLAB空间的内存非常小,仅占有Eden区的 1%,当然我们可以通过 ”-XX:TLABWasteTargetPercent“ 设置TLAB空间所占用Eden区的百分比大小
方法区
概述
在JDK7以前,习惯上把方法区,称为永久代;JDK8开始,使用元空间取代了永久代,而且元空间使用的是本地内存
栈、堆、方法区的交互关系
方法区存储什么?
存储已被虚拟机加载的类型信息、常量、静态变量、即时编译器编译后的代码缓存等
方法区的内部结构
类型信息
对每个加载的类型(类、接口、枚举、注解),JVM必须在方法区中存储以下类型信息:
- 1)这个类型的全限定类名
- 2)这个类型直接父类的完整有效名
- 3)这个类型的修饰符
- 4)这个类型直接接口的一个序列列表
域(Field)信息
JVM必须在方法区中保存类型的所有域的相关信息以及域的声明顺序
域的相关信息包括:
- 1)域名称
- 2)域类型
- 3)域修饰符
方法信息
JVM必须保存所有方法的以下信息,同域信息一样包括声明顺序:
- 1)方法名称
- 2)方法的返回类型
- 3)方法参数的数量和类型
- 4)方法的修饰符
- 5)方法的字节码
- 6)异常表
都看到这里了,点赞评论一下吧!!!
更多推荐
所有评论(0)