Kafka Topic Partition Offset 这一长串都是啥？

Offset 偏移量，是针对于单个partition存在的概念。

华为云开发者联盟

1109人浏览 · 2022-07-18 10:41:44

华为云开发者联盟 · 2022-07-18 10:41:44 发布

摘要：Offset 偏移量，是针对于单个partition存在的概念。

本文分享自华为云社区《Kafka Topic Partition Offset 这一长串都是啥？》，作者： gentle_zhou。

Kafka，作为一款分布式消息发布和订阅系统，被广泛应用于大数据传输场景；因为其高吞吐量、内置分区、冗余及容错性的特点，可谓是一个很好的大规模消息处理应用的解决方案（行为追踪，日志收集）。

基本架构组成

Kafka里几有如下大基本要素：

Producer：消息生产者，向Kafka cluster内的Broker发送消息；位于客户端内
Kafka cluster：包含了1个或多个broker的集群
broker：消息中间件处理节点，一个broker就是一个Kafka节点，一个broker里会有1个或多个Topic
Topic：主题，Kafka根据topic对消息进行归类；发布到Kafka集群的每条消息都需要指定一个topic
ZooKeeper cluster：一个分布式服务协调框架，管理和协调整个Kafka 集群
Consumer：消息消费者，向Kafka cluster内的Broker那读取消息；位于客户端内；每个Consumer属于一个特定的Consumer Group
Consumer Group：消息消费者组，多个不同的Consumer Group可以消费同一个消息，但是同一个Consumer Group中的不同Consumer不能消费同一个消息

以上几个元素它们之间是如何协调运作的呢？ Producer会将消息通过push 模式发布到到Kafka Clustr内的broker，consumer则通过监听把消息通过pull 模式从 broker 那订阅并消费。而zookeeper则用来管理和协调整个Kafka 集群。

好，解释了这些基本、表面的概念，我们回到标题这一长串，“Kafka Topic Partition Offset”。Topic作为一个消息的逻辑概念，同类的消息会被存到同一个topic下；每个 topic 可以有多个生产者向它发送消息，也可以有多个消费者去消费其中的消息。那么为何topic下会有1个或则多个partition呢？