prometheus常用表达式

##1. 系统使用率相关

1.1 内存使用率:

内存的使用率 = (所有非空闲状态CPU使用时间总和 )/(所有状态CPU时间总和)

(1 - (node_memory_MemAvailable_bytes{job=~"prometheus"} / (node_memory_MemTotal_bytes{job=~"prometheus"})))* 100
1.2 cpu使用率
(1 - avg(irate(node_cpu_seconds_total{job=~"prometheus",mode="idle"}[5m])) by (instance)) * 100
cpu总核数
 sum(count(node_cpu_seconds_total{instance=~"$node", mode='system'}) by (cpu,instance)) by(instance)
1.3 系统使用率
avg(irate(node_cpu_seconds_total{instance=~"$node",mode="system"}[1m])) by (instance)  *100
1.4 用户使用率
avg(irate(node_cpu_seconds_total{instance=~"$node",mode="user"}[1m])) by (instance) *100
1.5. 磁盘io使用率

avg(irate(node_cpu_seconds_total{instance=~"$node",mode="iowait"}[1m])) by (instance) *100
1.6. 总使用率

(1 - avg(irate(node_cpu_seconds_total{instance=~"$node",mode="idle"}[1m])) by (instance))*100

2. 内存相关:

2.1 总内存:

node_memory_MemTotal_bytes{instance=~"$node}
2.2 已用内存
node_memory_MemTotal_bytes{instance=~"$node"} - node_memory_MemAvailable_bytes{instance=~"$node"}
2.3 可用内存
node_memory_MemAvailable_bytes{instance=~"$node"}

3. 流量相关

3.1 该网口下载流量
increase(node_network_receive_bytes_total{instance=~"$node",device=~"$device"}[60m])
3.2 该网口上传流量
increase(node_network_transmit_bytes_total{instance=~"$node",device=~"$device"}[60m])
3.3 下载带宽
max(irate(node_network_receive_bytes_total{job=~"$job"}[5m])*8) by (instance)

3.4 最大上传带宽
max(irate(node_network_transmit_bytes_total{job=~"$job"}[5m])*8) by (instance)

4. 负载相关

1分钟负载
node_load1{instance=~"$node"}
5分钟负载
node_load5{instance=~"$node"}
15分钟负载
node_load15{instance=~"$node"}
cpu总核数
 sum(count(node_cpu_seconds_total{instance=~"$node", mode='system'}) by (cpu,instance)) by(instance)

5. 打开的文件描述

5.1 使用的文件描述符
node_filefd_allocated{instance=~"$node"}
5.2 使用的文件描述符占比
  (node_filefd_allocated{instance=~"$node"}/node_filefd_maximum{instance=~"$node"}) *100

6. io相关

io读取
irate(node_disk_read_time_seconds_total{instance=~"$node"}[1m]) / irate(node_disk_reads_completed_total{instance=~"$node"}[1m])
io写入
irate(node_disk_write_time_seconds_total{instance=~"$node"}[1m]) / irate(node_disk_writes_completed_total{instance=~"$node"}[1m])
最大读取
max(irate(node_disk_read_bytes_total{job=~"prometheus"}[5m])) by (instance)
最大写入
max(irate(node_disk_written_bytes_total{job=~"$job"}[5m])) by (instance)
读取速率
irate(node_disk_reads_completed_total{instance=~"$node"}[1m])
{{device}}_写入
irate(node_disk_writes_completed_total{instance=~"$node"}[1m])

8.# 二. 常用函数

  1. increase() 一段时间内的增长量
    increase(node_cpu_seconds_total[1m])
  2. sum() 加合的作用
  3. rate() 按照一个时间段,取counter再这个时间段中的平均每秒的增量
Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐