性能与压力测试

一、性能监控

1 、jvm内存模型

Snipaste_2021-12-11_21-07-36

  • 程序计数器ProgramCounterRegister:

    • 记录的是正在执行的虚拟机字节码指令的地址,
    • 此内存区域是唯一一个在JAVA虚拟机规范中没有规定任何OutOfMemoryError的区域
  • 虚拟机:VMStack

    • 描述的是JAVA方法执行的内存模型,每个方法在执行的时候都会创建一个栈帧,用于存储局部变量表,操作数栈,动态链接,方法接口等信息
    • 局部变量表存储了编译期可知的各种基本数据类型、对象引用
    • 线程请求的栈深度不够会报StackOverflowError异常
    • 栈动态扩展的容量不够会报OutOfMemoryError异常
    • 虚拟机栈是线程隔离的,即每个线程都有自己独立的虚拟机栈
  • 本地方法:NativeStack

    • 本地方法栈类似于虚拟机栈,只不过本地方法栈使用的是本地方法
  • 堆:Heap

    • 几乎所有的对象实例都在堆上分配内存

Snipaste_2021-12-11_21-08-15

2 、堆

所有的对象实例以及数组都要在堆上分配。堆是垃圾收集器管理的主要区域,也被称为“GC堆”;也是我们优化最多考虑的地方

堆可以细分为:

  • 新生代
    • Eden空间
    • FromSurvivor空间
    • ToSurvivor空间
  • 老年代
  • 永久代/元空间
    Java 8 以前永久代,受jvm管理,java 8 以后元空间,直接使用物理内存。因此,默认情况下,元空间的大小仅受本地内存限制。

Snipaste_2021-12-11_21-11-15

垃圾回收

从Java 8 开始,HotSpot已经完全将永久代(PermanentGeneration)移除,取而代之的是一个新的区域—元空间(MetaSpace)

Snipaste_2021-12-11_21-11-49

Snipaste_2021-12-11_21-12-10

3 、jconsole与jvisualvm

Jdk的两个小工具jconsole、jvisualvm(升级版的jconsole);通过命令行启动,可监控本地和远程应用。远程应用需要配置

1 、 jvisualvm 能干什么

监控内存泄露,跟踪垃圾回收,执行时内存、cpu分析,线程分析…

Snipaste_2021-12-11_21-13-31

运行:正在运行的

休眠:sleep

等待:wait

驻留:线程池里面的空闲线程

监视:阻塞的线程,正在等待锁

2 、安装插件方便查看 gc
  • cmd启动jvisualvm

  • 工具->插件

    Snipaste_2021-12-11_21-14-22

Snipaste_2021-12-11_21-15-03

  • 如果 503 错误解决:

    • 打开网址https://visualvm.github.io/pluginscenters.html

    • cmd查看自己的jdk版本,找到对应的

      Snipaste_2021-12-11_21-15-57

    • 复制下面查询出来的链接。并重新设置上即可

      Snipaste_2021-12-11_21-16-21

4 、监控指标

1 、中间件指标

Snipaste_2021-12-11_21-17-02

  • 当前正在运行的线程数不能超过设定的最大值。一般情况下系统性能较好的情况下,线程数最小值设置 50 和最大值设置 200 比较合适。

  • 当前运行的JDBC连接数不能超过设定的最大值。一般情况下系统性能较好的情况下,JDBC最小值设置 50 和最大值设置 200 比较合适。

  • GC频率不能频繁,特别是FULLGC更不能频繁,一般情况下系统性能较好的情况下,JVM最小堆大小和最大堆大小分别设置 1024M比较合适。

2 、数据库指标

Snipaste_2021-12-11_21-18-13

  • SQL耗时越小越好,一般情况下微秒级别。

  • 命中率越高越好,一般情况下不能低于 95 %。

  • 锁等待次数越低越好,等待时间越短越好。

压测内容压测线程数吞吐量/s90 %响应时间99 %响应时间
Nginx50233511944
Gateway5010367831
简单服务5011341817
首页一级菜单渲染50270 (db,thymeleaf)267365
首页渲染(开缓存)50290251365
首页渲染(开缓存、 优化数据库、关日 志)50700105183
三级分类数据获取502(db)/ 8 (加索引)
三级分类(优化业 务)50111571896
三级分类(使用redis作为缓存)50411153217
首页全量数据获取507(静态资源)
Nginx+Gateway50
Gateway+简单服务50312630125
全链路5080088310
  • 中间件越多,性能损失越大,大多都损失在网络交互了;

  • 业务:

    • Db(MySQL优化)
    • 模板的渲染速度(缓存)
    • 静态资源

5 、JVM分析&调优

jvm调优,调的是稳定,并不能带给你性能的大幅提升。服务稳定的重要性就不用多说了,保证服务的稳定,gc永远会是Java程序员需要考虑的不稳定因素之一。复杂和高并发下的服务,必须保证每次gc不会出现性能下降,各种性能指标不会出现波动,gc回收规律而且干净,找到合适的jvm设置。Fullgc最会影响性能,根据代码问题,避免fullgc频率。可以适当调大年轻代容量,让大对象可以在年轻代触发yonggc,调整大对象在年轻代的回收频次,尽可能保证大对象在年轻代回收,减小老年代缩短回收时间;

1 、几个常用工具
工具说明
jstack查看jvm线程运行状态,是否有死锁现象等等信息
jinfo可以输出并修改运行时的java进程的opts。
jps与unix上的ps类似,用来显示本地的java进程,可以查看本地运行着几个java程序,并显示他们的进程号。
jstat一个极强的监视VM内存工具。可以用来监视VM内存内的各种堆和非堆的大小及其内存使用量。
jmap打印出某个java进程(使用pid)内存内的所有’对象’的情况(如:产生那些对象,及其数量)
2 、命令示例
jstat工具特别强大,有众多的可选项,详细查看堆内各个部分的使用量,以及加载类的数量。使用时,需加上查看进程的进程id,和所选参数。
jstat-classpid显示加载class的数量,及所占空间等信息
jstat-compilerpid显示VM实时编译的数量等信息。
jstat-gcpid可以显示gc的信息,查看gc的次数,及时间
jstat-gccapacitypid堆内存统计,三代(young,old,perm)内存使用和占用大小
jstat-gcnewpid新生代垃圾回收统计
jstat-gcnewcapacitypid新生代内存统计
jstat-gcoldpid老年代垃圾回收统计
除了以上一个参数外,还可以同时加上两个数字,如:jstat-printcompilation 30242506 是每 250 毫秒打印一次,一共打印 6 次,还可以加上-h 3 每三行显示一下标题。
jstat-gcutil pid 1000100 : 1000 ms统计一次gc情况统计 100 次

在使用这些工具前,先用JPS命令获取当前的每个JVM进程号,然后选择要查看的JVM。

jinfo是 JDK 自带的命令,可以用来查看正在运行的 java应用程序的扩展参数,包括JavaSystem属性和JVM命令行参数;也可以动态的修改正在运行的 JVM 一些参数。当系统崩溃时,jinfo可以从core文件里面知道崩溃的Java应用程序的配置信息
jinfopid输出当前 jvm进程的全部参数和系统属性
jinfo-flagnamepid可以查看指定的 jvm 参数的值;打印结果:-无此参数,+有
jinfo-flag[+|-]namepid开启或者关闭对应名称的参数(无需重启虚拟机)
jinfo-flagname=valuepid修改指定参数的值
jinfo-flagspid输出全部的参数
jinfo-syspropspid输出当前 jvm进行的全部的系统属性
jmap可以生成heapdump文件,也可以查看堆内对象分析内存信息等,如果不使用这个命令,还可以使用-XX:+HeapDumpOnOutOfMemoryError参数来让虚拟机出现OOM的时候自动生成dump文件。
jmap-dump:live,format=b,file=dump.hprof pid
dump堆到文件,format指定输出格式,live指明是活着的对象,file指定文件名。eclipse可以打开这个文件
jmap-heap pid
打印heap的概要信息,GC使用的算法,heap的配置和使用情况,可以用此来判断内存目前的使用情况以及垃圾回收情况
jmap-finalizerinfo pid 打印等待回收的对象信息
jmap-histo:live pid 打印堆的对象统计,包括对象数、内存大小等。jmap-histo:live这个命令执行, JVM 会先触发 gc ,然后再统计信息
jmap-clstats pid
打印Java类加载器的智能统计信息,对于每个类加载器而言,对于每个类加载器而言,它的名称,活跃度,地址,父类加载器,它所加载的类的数量和大小都会被打印。此外,包含的字符串数量和大小也会被打印。
- F 强制模式。如果指定的pid没有响应,请使用jmap-dump或jmap-histo选项。此
模式下,不支持live子选项。
jmap -F -histopid
jstack是jdk自带的线程堆栈分析工具,使用该命令可以查看或导出 Java 应用程序中线程堆栈信息。
jstackpid输出当前 jvm 进程的全部参数和系统属性
3 、调优项

官方文档:https://docs.oracle.com/javase/8/docs/technotes/tools/unix/java.html#BGBCIEFC

二、压力测试

  • 压力测试考察当前软硬件环境下系统所能承受的最大负荷并帮助找出系统瓶颈所在。压测都是为了系统在线上的处理能力和稳定性维持在一个标准范围内,做到心中有数。

  • 使用压力测试,我们有希望找到很多种用其他测试方法更难发现的错误。有两种错误类型是:内存泄漏,并发与同步。

  • 有效的压力测试系统将应用以下这些关键条件:重复,并发,量级,随机变化。

1 、性能指标

  • 响应时间(ResponseTime:RT)
    • 响应时间指用户从客户端发起一个请求开始,到客户端接收到从服务器端返回的响应结束,整个过程所耗费的时间。
  • HPS(HitsPerSecond):每秒点击次数,单位是次/秒。
  • TPS(TransactionperSecond):系统每秒处理交易数,单位是笔/秒。
  • QPS(QueryperSecond):系统每秒处理查询次数,单位是次/秒。
    • 对于互联网业务中,如果某些业务有且仅有一个请求连接,那么TPS=QPS=HPS,一般情况下用TPS来衡量整个业务流程,用QPS来衡量接口查询次数,用HPS来表示对服务器单击请求。
  • 无论TPS、QPS、HPS,此指标是衡量系统处理能力非常重要的指标,越大越好,根据经验,一般情况下:
    • 金融行业: 1000 TPS~ 50000 TPS,不包括互联网化的活动
    • 保险行业: 100 TPS~ 100000 TPS,不包括互联网化的活动
    • 制造行业: 10 TPS~ 5000 TPS
    • 互联网电子商务: 10000 TPS~ 1000000 TPS
    • 互联网中型网站: 1000 TPS~ 50000 TPS
    • 互联网小型网站: 500 TPS~ 10000 TPS
  • 最大响应时间(MaxResponseTime)指用户发出请求或者指令到系统做出反应(响应)的最大时间。
  • 最少响应时间(MininumResponseTime)指用户发出请求或者指令到系统做出反应(响应)的最少时间。
  • 90 %响应时间( 90 %ResponseTime) 是指所有用户的响应时间进行排序,第 90 %的响应时间。
  • 从外部看,性能测试主要关注如下三个指标
    • 吞吐量:每秒钟系统能够处理的请求数、任务数。
    • 响应时间:服务处理一个请求或一个任务的耗时。
    • 错误率:一批请求中结果出错的请求所占比例。

2 、JMeter

1 、 JMeter 安装

https://jmeter.apache.org/download_jmeter.cgi
下载对应的压缩包,解压运行jmeter.bat即可

2 、 JMeter 压测示例
1 、添加线程组

Snipaste_2021-12-11_21-51-39

Snipaste_2021-12-11_21-52-03

线程组参数详解:
  • 线程数:虚拟用户数。一个虚拟用户占用一个进程或线程。设置多少虚拟用户数在这里也就是设置多少个线程数。
  • Ramp-UpPeriod(inseconds)准备时长:设置的虚拟用户数需要多长时间全部启动。如果线程数为 10 ,准备时长为 2 ,那么需要 2秒钟启动 10 个线程,也就是每秒钟启动 5 个线程。
  • 循环次数:每个线程发送请求的次数。如果线程数为 10 ,循环次数为 100 ,那么每个线程发送 100 次请求。总请求数为 10 * 100 = 1000 。如果勾选了“永远”,那么所有线程会一直发送请求,一到选择停止运行脚本。
  • DelayThreadcreationuntilneeded:直到需要时延迟线程的创建。
  • 调度器:设置线程组启动的开始时间和结束时间(配置调度器时,需要勾选循环次数为永远)
  • 持续时间(秒):测试持续时间,会覆盖结束时间
  • 启动延迟(秒):测试延迟启动时间,会覆盖启动时间
  • 启动时间:测试启动时间,启动延迟会覆盖它。当启动时间已过,手动只需测试时当前时间也会覆盖它。
  • 结束时间:测试结束时间,持续时间会覆盖它。
2 、添加HTTP请求

Snipaste_2021-12-11_21-53-40

Snipaste_2021-12-11_21-53-59

3 、添加监听器

Snipaste_2021-12-11_21-54-15

4 、启动压测&查看分析结果

Snipaste_2021-12-11_21-54-30

结果分析

  • 有错误率同开发确认,确定是否允许错误的发生或者错误率允许在多大的范围内;
  • Throughput吞吐量每秒请求的数大于并发数,则可以慢慢的往上面增加;若在压测的机器性能很好的情况下,出现吞吐量小于并发数,说明并发数不能再增加了,可以慢慢的往下减,找到最佳的并发数;
  • 压测结束,登陆相应的web服务器查看CPU等性能指标,进行数据的分析;
  • 最大的tps,不断的增加并发数,加到tps达到一定值开始出现下降,那么那个值就是最大的tps。
  • 最大的并发数:最大的并发数和最大的tps是不同的概率,一般不断增加并发数,达到一个值后,服务器出现请求超时,则可认为该值为最大的并发数。
  • 压测过程出现性能瓶颈,若压力机任务管理器查看到的cpu、网络和cpu都正常,未达到 90 %以上,则可以说明服务器有问题,压力机没有问题。
  • 影响性能考虑点包括:数据库、应用程序、中间件(tomact、Nginx)、网络和操作系统等方面
  • 首先考虑自己的应用属于 CPU 密集型还是 IO 密集型
3 、 JMeterAddressAlreadyinuse 错误解决

windows本身提供的端口访问机制的问题。
Windows提供给 TCP/IP链接的端口为 1024 - 5000 ,并且要四分钟来循环回收他们。就导致
我们在短时间内跑大量的请求时将端口占满了。

  • cmd中,用regedit命令打开注册表、

  • 在 HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters下,

    • 右击parameters,添加一个新的DWORD,名字为MaxUserPort
    • 然后双击MaxUserPort,输入数值数据为 65534 ,基数选择十进制(如果是分布式运行的话,控制机器和负载机器都需要这样操作哦)
  • 修改配置完毕之后记得重启机器才会生效
    https://support.microsoft.com/zh-cn/help/196271/when-you-try-to-connect-from-tcp-ports-greater-than-5000-you-receive-t
    TCPTimedWaitDelay: 30

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐