kafka的数据分区和消费者数量的关系

kafka数据分区策略包括，轮询分区，随机分区，还有一些其他的分区策略，作为使用者，我们就不去深入探究了轮询策略也称 Round-robin 策略，即顺序分配。比如一个主题下有 3 个分区，那么第一条消息被发送到分区 0，第二条被发送到分区 1，第三条被发送到分区 2，以此类推。当生产第 4 条消息时又会重新开始，即将其分配到分区 0，就像下面这张图展示的那样。随机策略也称 Randomness

kangshuangzhu

6607人浏览 · 2022-03-13 17:06:09

kangshuangzhu · 2022-03-13 17:06:09 发布

kafka数据分区策略包括，轮询分区，随机分区，还有一些其他的分区策略，作为使用者，我们就不去深入探究了

轮询策略

也称 Round-robin 策略，即顺序分配。比如一个主题下有 3 个分区，那么第一条消息被发送到分区 0，第二条被发送到分区 1，第三条被发送到分区 2，以此类推。当生产第 4 条消息时又会重新开始，即将其分配到分区 0，就像下面这张图展示的那样。

在这里插入图片描述

随机策略

也称 Randomness 策略。所谓随机就是我们随意地将消息放置到任意一个分区上，如下面这张图所示。

在这里插入图片描述

其中轮询分区是使用最多的分区方式。无论哪种分区策略都说明了每个分区中只能保存一部分的数据。

一个消费者组中可以有多个消费者，我们已经知道每个消费者组都可以消费到全部的数据，但是如果同一个消费者组中有多个消费者，消息是怎么消费的呢？

我们来做一个实验：

创建一个topic和producer默认分区是2：

sh /home/kafka/kafka_2.12-3.1.0/bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test2

创建一个消费者：

sh /home/kafka/kafka_2.12-3.1.0/bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning --consumer-property group.id=group_mytes

然后发送几条消息，如下图，左边是发送的消息，右边是接收的消息。

不出意料的，消费者能够接收到所有的消息