Kafka坑之一：Lag与HW、LEO

kafka的消息滞后（Lag）是指已消费的偏移量（ConsumerOffset）与水位线（HW）之间的消息差，并非分区（partition）中已消费的偏移量（ConsumerOffset）与当前分区的最高日志位移（LOG-END-OFFSET简称LEO）之间的差，也就是说，并不是生产者所见的offset与已消费的offset的差。......

0.7%

2788人浏览 · 2022-07-08 22:52:25

0.7% · 2022-07-08 22:52:25 发布

先说结论：kafka的消息滞后（Lag）是指已消费的偏移量（ConsumerOffset）与水位线（HW）之间的消息差，并非分区（partition）中已消费的偏移量（ConsumerOffset）与当前分区的最高日志位移（LOG-END-OFFSET简称LEO）之间的差，也就是说，并不是生产者所见的offset与已消费的offset的差。

一方面，对kafka来说，HW是其备份和恢复的关键，kafka是根据HW来判断数据是否丢失和恢复数据，而HW与LEO之间的数据有可能会丢失，因此这部分未同步的数据实际上相当于是无效数据，这部分数据实际只对生产者有意义（已经产出的意义，生产者可以通过kafka ack的设置，记录产出的数据位置，以帮助恢复HW与LEO之间的数据，恢复方法也只是重新生产这部分数据，如果无法重新生产，则数据丢失）。

另一方面，leader收到消息更新自己的LEO，follower从再从leader处同步消息，这个时间差决定了leader和follower之间存在消息差，同时也决定了HW和各个partiton的LEO之间存在的消息差，消费者在消费消息时对LEO是无察觉的，HW决定了消费者能消费到的最大offset，而LEO仅由kafka管理。因此对消费者来说，LEO也是无意义的。

在kafka有查看消费组详情的命令：kafka-consumer-groups.sh --bootstrap-server ip:port --group groupid --describe，通过这个命令可以根据groupid查看LAG、CURRENT-OFFSET、LOG-END-OFFSET等信息，LAG是消息滞后量，CURRENT-OFFSET是指已消费的偏移量（ConsumerOffset），而此处LOG-END-OFFSET却不是partition最高日志位移LEO，而是水位线HW！！！LAG即是HW与已消费的偏移量（ConsumerOffset）的差！！！

华为开发者空间

华为开发者空间，是为全球开发者打造的专属开发空间，汇聚了华为优质开发资源及工具，致力于让每一位开发者拥有一台云主机，基于华为根生态开发、创新。

更多推荐

华为开发者空间云开发环境（容器）操作指导

华为开发者空间

【openGauss】Oracle与openGauss/GaussDB数据一致性高效核对方案

华为开发者空间

【GaussDB】在逻辑复制中剔除指定用户的事务

基于逻辑复制标签实现过滤，技术上可行，但打标签这个附加操作需要在执行sql前执行（除非使用触发器，但触发器属于高风险操作，不建议使用），如果漏执行，将会存在错误覆盖目标库的风险。历史表归档方案通过在源库建立历史表存储归档数据，配置复制规则排除历史表的删除操作，虽然会增加IO开销，但实现简单、安全性高，避免了事务过滤可能带来的风险。虽然插入历史表会产生额外IO，可能使数据归档操作时间翻倍，但相比剔除