iostat主要用于监控系统设备的IO负载情况,iostat提供了丰富的参数给我们查询各种维度的io数据, iostat首次运行时显示自系统启动开始的各项统计信息,之后运行iostat将显示自上次运行该命令以后的统计信息。用户可以通过指定统计的次数和时间来获得所需的统计信息。

一、命令相关参数

命令使用:

iostat [ -c ] [ -d ] [ -N ] [ -n ] [ -h ] [ -k | -m ] [ -t ] [ -V ] [ -x ] [ -y ] [ -z ] [ -j { ID | LABEL | PATH | UUID | … } [ device […] | ALL ] ] [ device […] | ALL ] [ -p [ device [,…] | ALL ] ] [ interval [ count ] ]

看着有点乱,我们可以归纳为:

iostat [-参数] [指定磁盘] [采集周期频率] [采集次数]

比如iostat -k sda 5 2表示采集sda磁盘上的相关信息,每5秒采集一次,一共采集2次。-k参数表示以kb来显示。

相关参数介绍:

参数    详解

-c    只显示cpu相关统计信息(默认是同时显示cpu和磁盘信息)

-d    只显示磁盘统计信息(默认是同时显示cpu和磁盘信息)

-h    使用NFS的输出报告更加友好可读。

-j { ID | LABEL | PATH | UUID | … }    磁盘列表的Device列要用什么维度来描述磁盘

-k    默认情况下,iostat的输出是以block作为计量单位,加上这个参数可以以kb作为计量单位显示。(该参数仅在linux内核版本2.4以后数据才是准确的)

-m    默认情况下,iostat的输出是以block作为计量单位,加上这个参数可以以mb作为计量单位显示。(该参数仅在linux内核版本2.4以后数据才是准确的)

-N    显示磁盘阵列(LVM) 信息

-n    显示NFS相关统计数据(network fileSystem)。(该参数只在linux内核版本2.6.17之后有用)

-p [ { device [,…] | ALL } ]    显示磁盘分区的相关统计信息(默认粒度只到磁盘,没有显示具体的逻辑分区)

-t    显示终端和CPU的信息,每次输出报告时显示系统时间。

-V    显示当前iostat的版本信息

-x    显示更详细的磁盘报告信息,默认只显示六列,加上该参数后会显示更详细的信息。(该参数需要在内核版本2.4之后才能使用)

-y    跳过不显示第一次报告的数据,因为iostat使用的是采样统计,所以iostat的第一次输出的数据是自系统启动以来累计的数据

-z    只显示在采样周期内有活动的磁盘

二、命令演示

# # iostat -c 2 3
Linux 3.10.0-1062.el7.x86_64 (ruioracle43)      02/23/2022      _x86_64_        (8 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.12    0.00    0.10    0.00    0.00   99.77

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.13    0.00    0.13    0.00    0.00   99.75

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.13    0.00    0.13    0.00    0.00   99.75
%user:CPU处在用户模式下的时间百分比。

%nice:CPU处在带NICE值的用户模式下的时间百分比。

%system:CPU处在系统模式下的时间百分比。

%iowait:CPU等待输入输出完成时间的百分比。如果%iowait的值过高,表示硬盘存在I/O瓶颈。

%steal:管理程序维护另一个虚拟处理器时,虚拟CPU的无意识等待时间百分比。

%idle:CPU空闲时间百分比。
     * 如果%idle值高,表示CPU较空闲。
     * 如果%idle值高但系统响应慢时,可能是CPU等待分配内存,应加大内存容量。
     * 如果%idle值持续低于10,表明CPU处理能力相对较低,系统中最需要解决的资源是CPU。
# iostat -c sda 3 2
Linux 3.10.0-1062.el7.x86_64 (ruitest01)        08/18/2021      _x86_64_        (8 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.11    0.00    0.12    0.00    0.00   99.77

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               2.07         1.98        29.22    3715725   54933545

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.08    0.00    0.13    0.04    0.00   99.75

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               2.67         2.67        17.33          8         52
# iostat -d  3 2
Linux 3.10.0-1062.el7.x86_64 (ruitest01)        08/18/2021      _x86_64_        (8 CPU)

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               2.07         1.98        29.22    3716213   54945198
scd0              0.00         0.00         0.00       1028          0
dm-0              2.08         1.97        28.57    3696199   53712983
dm-1              0.00         0.00         0.00       2204          0
dm-2              0.01         0.00         0.65       1430    1216787

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               3.67         0.00        46.67          0        140
scd0              0.00         0.00         0.00          0          0
dm-0              3.67         0.00        46.67          0        140
dm-1              0.00         0.00         0.00          0          0
dm-2              0.00         0.00         0.00          0          0
--显示设备(磁盘)使用状态,以kb作为计量单位显示,每隔2秒刷新一次,共显示3次 。
# iostat -dk 2 3
Linux 3.10.0-1062.el7.x86_64 (ruioracle43)      02/23/2022      _x86_64_        (8 CPU)
#以下第一段忽略
Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               1.35         0.89        70.29     552093   43396658
dm-0              0.64         0.56        29.78     343291   18387249
dm-1              0.16         0.31         0.32     190216     196956
dm-2              0.00         0.00         0.00       1118       2458
dm-3              0.72         0.00        40.16       1169   24794583

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               1.00         0.00        16.00          0         32
dm-0              0.50         0.00         8.00          0         16
dm-1              0.00         0.00         0.00          0          0
dm-2              0.00         0.00         0.00          0          0
dm-3              0.50         0.00         8.00          0         16

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               4.50         0.00        66.00          0        132
dm-0              2.00         0.00        32.00          0         64
dm-1              0.00         0.00         0.00          0          0
dm-2              0.00         0.00         0.00          0          0
dm-3              2.50         0.00        34.00          0         68
tps:每秒I/O数(即IOPS,磁盘连续读和连续写之和)

kB_read/s:每秒从设备(drive expressed)读取的数据量(单位为Kilobytes)。

kB_wrtn/s:每秒向设备(drive expressed)写入的数据量(单位为Kilobytes)。

kB_read:读取的总数据量(单位为Kilobytes)。

kB_wrtn:写入的总数据量(单位为Kilobytes)。

在上面的例子中,我们可以看到磁盘sda以及它的各个分区的统计数据,当时统计的磁盘sda总TPS是1 ~ 4.5,下面是各个分区的TPS。
(注意:因为是瞬间值,所以总TPS并不严格等于各个分区TPS的总和。)

--显示详细信息,以kb作为计量单位显示,每隔2秒刷新一次,共显示3次 。
# iostat -xdk 2 3
Linux 3.10.0-1062.el7.x86_64 (ruioracle43)      02/23/2022      _x86_64_        (8 CPU)

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
sda               0.06     0.10    0.05    1.30     0.89    70.24   105.05     0.01    5.20    4.19    5.24   0.26   0.03
dm-0              0.00     0.00    0.04    0.60     0.56    29.76    94.41     0.00    3.05    5.57    2.89   0.26   0.02
dm-1              0.00     0.00    0.08    0.08     0.31     0.32     8.04     0.00   25.70    0.54   49.76   0.06   0.00
dm-2              0.00     0.00    0.00    0.00     0.00     0.00    37.06     0.00    0.41    0.68    0.21   0.38   0.00
dm-3              0.00     0.00    0.00    0.72     0.00    40.13   112.10     0.01    7.08    0.72    7.08   0.24   0.02

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
sda               0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
dm-0              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
dm-1              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
dm-2              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
dm-3              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
sda               0.00     0.00    0.00    3.00     0.00    30.00    20.00     0.00    0.00    0.00    0.00   0.00   0.00
dm-0              0.00     0.00    0.00    0.50     0.00     8.00    32.00     0.00    0.00    0.00    0.00   0.00   0.00
dm-1              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
dm-2              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
dm-3              0.00     0.00    0.00    2.50     0.00    22.00    17.60     0.00    0.00    0.00    0.00   0.00   0.00
rrqm/s:每秒进行 merge 的读操作数目,即每秒这个设备相关的读取请求有多少被Merge了,也即 delta(rmerge)/s。当系统调用需要读取数据的时候,VFS将请求发到各个FS,如果FS发现不同的读取请求读取的是相同Block的数据,FS会将这个请求合并Merge。

wrqm/s:每秒进行 merge 的写操作数目,即每秒这个设备相关的写入请求有多少被Merge了,也即 delta(wmerge)/s。

r/s: 每秒完成的读 I/O 设备次数,即 delta(rio)/s 。

w/s: 每秒完成的写 I/O 设备次数,即 delta(wio)/s 。

rkB/s: 每秒读K字节数,是 rsect/s 的一半,因为每扇区大小为512字节.(需要计算)。

wkB/s: 每秒写K字节数,是 wsect/s 的一半.(需要计算)。

avgrq-sz: 平均每次设备I/O操作的数据大小 (扇区),即delta(rsect+wsect)/delta(rio+wio)。

avgqu-sz: 平均I/O队列长度,即 delta(aveq)/s/1000 (因为aveq的单位为毫秒)。

await:平均每次设备I/O操作的等待时间 (毫秒),即 delta(ruse+wuse)/delta(rio+wio)。这里可以理解为IO的响应时间,一般地系统IO响应时间应该低于5ms,如果大于10ms就比较大了。

r_await:每个读操作平均所需的时间;不仅包括硬盘设备读操作的时间,还包括了在kernel队列中等待的时间。

w_await:每个写操作平均所需的时间;不仅包括硬盘设备写操作的时间,还包括了在kernel队列中等待的时间。

svctm: 平均每次设备I/O操作的服务时间 (毫秒),即 delta(use)/delta(rio+wio)。

%util:代表磁盘繁忙程度。100% 表示磁盘繁忙, 0%表示磁盘空闲。%util为在统计时间内所有处理IO时间,除以总共统计时间。例如,如果统计间隔1秒【本次案例是2秒】,该设备有0.8秒在处理IO,而0.2秒闲置,那么该设备的%util = 0.8/1 = 80%,所以该参数暗示了设备的繁忙程度。一般地,如果该参数是100%表示设备已经接近满负荷运行了(当然如果是多磁盘,即使%util是100%,因为磁盘的并发能力,所以磁盘使用未必就到了瓶颈)。
# iostat -h  3 2
Linux 3.10.0-1062.el7.x86_64 (ruitest01)        08/18/2021      _x86_64_        (8 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.11    0.00    0.12    0.00    0.00   99.77

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda
                  2.07         1.98        29.22    3716333   54946890
scd0
                  0.00         0.00         0.00       1028          0
dm-0
                  2.08         1.97        28.57    3696319   53714675
dm-1
                  0.00         0.00         0.00       2204          0
dm-2
                  0.01         0.00         0.65       1430    1216787

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.13    0.00    0.08    0.00    0.00   99.79

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda
                  1.67         0.00        14.67          0         44
scd0
                  0.00         0.00         0.00          0          0
dm-0
                  1.67         0.00        14.67          0         44
dm-1
                  0.00         0.00         0.00          0          0
dm-2
                  0.00         0.00         0.00          0          0
# iostat -k  3 2
Linux 3.10.0-1062.el7.x86_64 (ruitest01)        08/18/2021      _x86_64_        (8 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.11    0.00    0.12    0.00    0.00   99.77

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               2.07         1.98        29.22    3716813   54959793
scd0              0.00         0.00         0.00       1028          0
dm-0              2.08         1.97        28.57    3696799   53727578
dm-1              0.00         0.00         0.00       2204          0
dm-2              0.01         0.00         0.65       1430    1216787

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.17    0.00    0.13    0.00    0.00   99.71

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               5.67         0.00        39.33          0        118
scd0              0.00         0.00         0.00          0          0
dm-0              6.67         0.00        39.33          0        118
dm-1              0.00         0.00         0.00          0          0
dm-2              0.00         0.00         0.00          0          0
# iostat -m  3 2
Linux 3.10.0-1062.el7.x86_64 (ruitest01)        08/18/2021      _x86_64_        (8 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.11    0.00    0.12    0.00    0.00   99.77

Device:            tps    MB_read/s    MB_wrtn/s    MB_read    MB_wrtn
sda               2.07         0.00         0.03       3629      53673
scd0              0.00         0.00         0.00          1          0
dm-0              2.08         0.00         0.03       3610      52469
dm-1              0.00         0.00         0.00          2          0
dm-2              0.01         0.00         0.00          1       1188

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.08    0.00    0.13    0.00    0.00   99.79

Device:            tps    MB_read/s    MB_wrtn/s    MB_read    MB_wrtn
sda               1.67         0.00         0.01          0          0
scd0              0.00         0.00         0.00          0          0
dm-0              1.67         0.00         0.01          0          0
dm-1              0.00         0.00         0.00          0          0
dm-2              0.00         0.00         0.00          0          0
# iostat -N  3 2
Linux 3.10.0-1062.el7.x86_64 (ruitest01)        08/18/2021      _x86_64_        (8 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.11    0.00    0.12    0.00    0.00   99.77

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               2.07         1.98        29.23    3716933   54962441
scd0              0.00         0.00         0.00       1028          0
rhel-root         2.08         1.97        28.57    3696919   53730226
rhel-swap         0.00         0.00         0.00       2204          0
rhel-home         0.01         0.00         0.65       1430    1216787

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.08    0.00    0.08    0.00    0.00   99.83

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               1.67         0.00        14.67          0         44
scd0              0.00         0.00         0.00          0          0
rhel-root         1.67         0.00        14.67          0         44
rhel-swap         0.00         0.00         0.00          0          0
rhel-home         0.00         0.00         0.00          0          0
# iostat -p  3 2
Linux 3.10.0-1062.el7.x86_64 (ruitest01)        08/18/2021      _x86_64_        (8 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.11    0.00    0.12    0.00    0.00   99.77

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               2.07         1.98        29.23    3717053   54965125
sda1              0.00         0.01         0.01      12716      15427
sda2              2.07         1.97        29.22    3702793   54949698
scd0              0.00         0.00         0.00       1028          0
dm-0              2.08         1.97        28.57    3697039   53732910
dm-1              0.00         0.00         0.00       2204          0
dm-2              0.01         0.00         0.65       1430    1216787

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.17    0.00    0.08    0.04    0.00   99.71

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               3.67         0.00        46.67          0        140
sda1              0.00         0.00         0.00          0          0
sda2              3.67         0.00        46.67          0        140
scd0              0.00         0.00         0.00          0          0
dm-0              3.67         0.00        46.67          0        140
dm-1              0.00         0.00         0.00          0          0
dm-2              0.00         0.00         0.00          0          0
# iostat -t  3 2
Linux 3.10.0-1062.el7.x86_64 (ruitest01)        08/18/2021      _x86_64_        (8 CPU)

08/18/2021 11:09:08 AM
avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.11    0.00    0.12    0.00    0.00   99.77

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               2.07         1.98        29.23    3717173   54966385
scd0              0.00         0.00         0.00       1028          0
dm-0              2.08         1.97        28.57    3697159   53734170
dm-1              0.00         0.00         0.00       2204          0
dm-2              0.01         0.00         0.65       1430    1216787

08/18/2021 11:09:11 AM
avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.13    0.00    0.04    0.00    0.00   99.83

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               3.67         0.00        46.67          0        140
scd0              0.00         0.00         0.00          0          0
dm-0              3.67         0.00        46.67          0        140
dm-1              0.00         0.00         0.00          0          0
dm-2              0.00         0.00         0.00          0          0
# iostat -V  3 2
sysstat version 10.1.5
(C) Sebastien Godard (sysstat <at> orange.fr)
# iostat -x  3 2
Linux 3.10.0-1062.el7.x86_64 (ruitest01)        08/18/2021      _x86_64_        (8 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.11    0.00    0.12    0.00    0.00   99.77

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
sda               0.00     0.02    0.18    1.90     1.98    29.25    30.10     0.00    0.32    0.91    0.26   0.19   0.04
scd0              0.00     0.00    0.00    0.00     0.00     0.00   114.22     0.00   13.72   13.72    0.00  13.39   0.00
dm-0              0.00     0.00    0.18    1.90     1.97    28.58    29.36     0.00    0.32    0.91    0.26   0.20   0.04
dm-1              0.00     0.00    0.00    0.00     0.00     0.00    50.09     0.00    0.99    0.99    0.00   0.89   0.00
dm-2              0.00     0.00    0.00    0.01     0.00     0.66   140.31     0.00    0.38    2.06    0.36   0.13   0.00

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.04    0.00    0.08    0.00    0.00   99.87

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
sda               0.00     0.00    0.00    4.33     0.00    57.33    26.46     0.00    0.15    0.00    0.15   0.15   0.07
scd0              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
dm-0              0.00     0.00    0.00    4.33     0.00    57.33    26.46     0.00    0.15    0.00    0.15   0.15   0.07
dm-1              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
dm-2              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
# iostat -y  3 2
Linux 3.10.0-1062.el7.x86_64 (ruitest01)        08/18/2021      _x86_64_        (8 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.17    0.00    0.13    0.04    0.00   99.67

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               3.67         0.00        46.67          0        140
scd0              0.00         0.00         0.00          0          0
dm-0              3.67         0.00        46.67          0        140
dm-1              0.00         0.00         0.00          0          0
dm-2              0.00         0.00         0.00          0          0

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.08    0.00    0.13    0.00    0.00   99.79

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               1.67         0.00        14.67          0         44
scd0              0.00         0.00         0.00          0          0
dm-0              1.67         0.00        14.67          0         44
dm-1              0.00         0.00         0.00          0          0
dm-2              0.00         0.00         0.00          0          0
# iostat -z  3 2
Linux 3.10.0-1062.el7.x86_64 (ruitest01)        08/18/2021      _x86_64_        (8 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.11    0.00    0.12    0.00    0.00   99.77

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               2.07         1.98        29.25    3717413   55012803
scd0              0.00         0.00         0.00       1028          0
dm-0              2.08         1.97        28.58    3697399   53759341
dm-1              0.00         0.00         0.00       2204          0
dm-2              0.01         0.00         0.66       1430    1238034

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.08    0.00    0.13    0.00    0.00   99.79

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               1.67         0.00        14.67          0         44
dm-0              1.67         0.00        14.67          0         44

通过uname -a可以查看当前linux系统的内核版本。2.4版本后一个block的大小通常是512byte

默认情况下,第一次的输出信息的数据是从操作系统启动以来的累计数据,第二次开始才是真正的采样周期内的真实数据,这点和top命令很像。我们可以加上-y来过滤掉第一次的输出信息。

1、cpu部分的统计

这里的cpu统计信息只是取平均值,如果是多核cpu,想看每核cpu的具体统计信息,可以使用top命令。

下面的百分比计算一般采用公式: 消耗时间*100.0/采样时间

%user: cpu消耗在用户空间的时间占比
 
%nice: 被用户修改过优先级的进程运行时间占比
 
%system: cpu消耗在内核空间的时间占比
 
%iowait: cpu在等待IO的时间占比(需要满足CPU资源空闲而磁盘IO在工作的条件)
 
%steal: 当hypervisor正服务于另外一个虚拟处理器时无意识地等待虚拟CPU所占有的时间百分比
 
%idle: cpu空闲时间百分比

iowait可以作为磁盘是否是系统瓶颈的参考值,但并不能全信。iowait表示的含义是cpu没在工作而在等待io的时间占比,在cpu高速运转的情况下也会出现iowait高的情况,这并不能表明磁盘性能就有问题。唯一能说明磁盘性能差的应该是根据磁盘的read/write时间,一般来说,一次读写就是一次寻道+一次旋转延迟+数据传输的时间。现代硬盘数据传输就是几微秒或者几十微秒的事情,远远小于寻道时间220ms和旋转延迟48ms,所以只计算这两个时间就差不多了,也就是15~20ms。如果磁盘读写时间大于20ms,就要考虑是否是磁盘读写太多,导致磁盘性能降低了。

如果%iowait的值过高,表示硬盘存在I/O瓶颈,%idle值高,表示CPU较空闲,如果%idle值高但系统响应慢时,有可能是CPU等待分配内存,此时应加大内存容量。%idle值如果持续低于10,那么系统的CPU处理能力相对较低,表明系统中最需要解决的资源是CPU。

2、磁盘部分的统计

在没加-x参数时,默认输出以下六列:
 
Device:磁盘名称,可以通过-p参数改成ID、PATH、UUID的形式
 
tps:取样周期内,磁盘的读写次数。但是由于有时操作系统会合并多个IO请求成一个,因此这个参数并不是十分准确。
 
Blk_read/s:取样周期内,每秒读取的block数量(通过参数-k -m可以将单位改成kb、mb)
 
Blk_wrtn/s:取样周期内,每秒写入的block数量(通过参数-k -m可以将单位改成kb、mb)
 
Blk_read:取样周期内,读取的总block数量(通过参数-k -m可以将单位改成kb、mb)
 
Blk_wrtn:取样周期内,写入的总block数量(通过参数-k -m可以将单位改成kb、mb)

如果加了-x参数,会显示更加详细的数据,如下图:
在这里插入图片描述

rrqm/s:采样周期内,每秒merge的读请求数量

wrqm/s:采样周期内,,每秒merge的写请求数量

r/s:采样周期内,每秒的读请求数量

w/s:采样周期内,每秒的写请求数量

rsec/s:采样周期内,每秒读取的扇区数量(通过参数-k -m可以将单位改成kb、mb)

wsec/s:采样周期内,每秒写入的扇区数量(通过参数-k -m可以将单位改成kb、mb)

avgrq-sz:采样周期内,平均IO请求的大小(以扇区为单位)

avgqu-sz:采样周期内,平均IO队列长度(在等待被执行的IO请求)

await:采样周期内,IO请求的平均时间(排队时长+IO服务时长),单位是毫秒

svctm:采样周期内,IO请求的平均服务时间,排除排队的时长,单位是毫秒(该统计维度的数值不可信,后面的iostat版本会移除这项统计值)

%util:采样周期内,IO忙碌的时间百分比,如果这个值接近100,说明此时IO已经满负荷了
# iostat -cxdk 2 3
Linux 3.10.0-1062.el7.x86_64 (ruioracle43)      02/23/2022      _x86_64_        (8 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.12    0.00    0.10    0.00    0.00   99.77

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
sda               0.06     0.10    0.05    1.30     0.89    70.08   104.86     0.01    5.19    4.19    5.23   0.26   0.03
dm-0              0.00     0.00    0.04    0.60     0.55    29.70    94.23     0.00    3.05    5.57    2.89   0.26   0.02
dm-1              0.00     0.00    0.08    0.08     0.31     0.32     8.04     0.00   25.70    0.54   49.76   0.06   0.00
dm-2              0.00     0.00    0.00    0.00     0.00     0.00    37.06     0.00    0.41    0.68    0.21   0.38   0.00
dm-3              0.00     0.00    0.00    0.72     0.00    40.03   111.91     0.01    7.07    0.72    7.07   0.24   0.02

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.13    0.00    0.13    0.00    0.00   99.75

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
sda               0.00     0.00    0.00    1.00     0.00    16.00    32.00     0.00    0.00    0.00    0.00   0.00   0.00
dm-0              0.00     0.00    0.00    0.50     0.00     8.00    32.00     0.00    0.00    0.00    0.00   0.00   0.00
dm-1              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
dm-2              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
dm-3              0.00     0.00    0.00    0.50     0.00     8.00    32.00     0.00    0.00    0.00    0.00   0.00   0.00

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.06    0.00    0.13    0.00    0.00   99.81

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
sda               0.00     0.00    0.00    1.00     0.00    16.00    32.00     0.00    0.50    0.00    0.50   0.50   0.05
dm-0              0.00     0.00    0.00    0.50     0.00     8.00    32.00     0.00    1.00    0.00    1.00   1.00   0.05
dm-1              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
dm-2              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
dm-3              0.00     0.00    0.00    0.50     0.00     8.00    32.00     0.00    0.00    0.00    0.00   0.00   0.00
I/O 系统也和超市排队有很多类似之处:

r/s+w/s 类似于交款人的总数;

平均队列长度(avgqu-sz)类似于单位时间里平均排队人的个数;

平均服务时间(svctm:毫秒)类似于收银员的收款速度(收银员平均收银耗时) 应该 < await ;

平均等待时间(await:毫秒)类似于平均每人的等待时间;

平均I/O数据(avgrq-sz)类似于平均每人所买的东西多少;

I/O 操作率 (%util)类似于收款台前有人排队的时间比例。

我们可以根据这些数据分析出 I/O 请求的模式,以及 I/O 的速度和响应时间.

总结

网上许多博客都说用svctm可以衡量磁盘的性能,但是在iostat的man文档中有提到,让我们不要相信这个列的输出值,并且在后面的版本中会去除这个统计项。

svctm 一般要小于 await (因为同时等待的请求的等待时间被重复计算了),svctm 的大小一般和磁盘性能有关,CPU/内存的负荷也会对其有影响,请求过多也会间接导致 svctm 的增加。await 的大小一般取决于服务时间(svctm) 以及I/O 队列的长度和 I/O 请求的发出模式。如果 svctm 比较接近 await,说明I/O 几乎没有等待时间;如果 await 远大于 svctm,说明 I/O 队列太长,应用得到的响应时间变慢,如果响应时间超过了用户可以容许的范围,这时可以考虑更换更快的磁盘,调整内核 elevator 算法,优化应用,或者升级 CPU。

所以要统计磁盘性能,综合来说还是用await列的信息来判断。一般的磁盘读写性能在20ms左右,如果await比这个数值大很多,就说明当前系统存在很大的IO问题。

avgqu-sz (平均每人所买的东西多少) 也是个做 IO 调优时需要注意的地方,这个就是直接每次操作的数据的大小,如果次数多,但数据拿的小的话,其实 IO 也会很小.如果数据拿的大,IO 的数据才会高。也可以通过 avgqu-sz × ( r/s or w/s ) = rsec/s or wsec/s计算。如果avgqu-sz比较大,也表示有大量IO在等待。但由于 avgqu-sz 是按照单位时间的平均值,所以不能反映瞬间的 I/O 洪水。

如果 %util 接近 100%,说明产生的I/O请求太多,I/O系统已经满负荷,该磁盘可能存在瓶颈。 idle小于70% IO压力就较大了,一般读取速度有较多的wait。同时可以结合vmstat 查看查看b参数(等待资源的进程数)和wa参数(IO等待所占用的CPU时间的百分比,高过30%时IO压力高)。

另外 await 的参数也要多和 svctm 来参考。差的过高就一定有 IO 的问题。avgqu-sz 也是个做 IO 调优时需要注意的地方,这个就是直接每次操作的数据的大小,如果次数多,但数据拿的小的话,其实 IO 也会很小。如果数据拿的大,才IO 的数据会高。也可以通过 avgqu-sz × ( r/s or w/s ) = rsec/s or wsec/s。也就是讲,读定速度是这个来决定的。

和大多的系统指标统计一样,iostat的数据也基本来自/proc虚拟文件系统。比如 iostat -x 的数据则来自于 /proc/diskstats文件下的数据。另外,各种linux发行版的proc虚拟文件系统实现可能会有偏差,因此iostat输出的内容也可能不太一致。

下面分享一个不错的例子(I/O 系统 vs. 超市排队):
我们在超市排队时,怎么决定该去哪个收银台呢?
1)首当是看排队人数,5个人总比20人要快吧?
2)除了数人头,我们也常常看看前面人购买的东西多少,如果前面有个采购了一星期食品的大妈,那么可以考虑换个队排了。
3)还需要卡收银员的速度,如果碰上了连钱都点不清楚的新手,那就有的等了。
4)另外,时机也很重要,可能 5 分钟前还人满为患的收款台,现在已是人去楼空,这时候交款可是很爽啊,当然,前提是那过去的 5 分钟里所做的事情比排队要有意义 (不过我还没发现什么事情比排队还无聊的)。


参考文章:
https://mp.weixin.qq.com/s/SU19-3a2sinvE9CJXEbX-w
https://www.jianshu.com/p/cec0b9f052cb
https://www.jianshu.com/p/556cc01ccfe1

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐