一、可靠性:分布式结构存储数据,构建多台kafkaServer集群

分布式存储:往kafka中生产数据时,必然这个数据被分布式存放了。
分区:每一个主题Topic都可以有多个分区

  1. 当生产者往主题中生产数据时,会写入不同的分区
  2. 每个分区存储在不同的机器上
  3. 每一条数据会根据分区规则写入对应的分区
二、可扩展性:横向扩展,机器不够加机器
三、耐用性:Kafka中的数据分区存储在每台机器的磁盘上的,数据存储在Kafka中不易丢失。
  • 为什么我们以前看到的读写磁盘都比较慢?
  • 磁盘中分散存放的,牺牲大量的寻址时间
  • 数据时分散的无序的
  • 只要你的数据有序的并且顺序存储硬盘
  • 读硬盘依旧会很快
四、性能:Kafka顺序读写硬盘策略,不使用寻址磁盘策略
五、安全:分区、副本

留个问题 :如果某台消息队列的机器故障了,kafka时怎么保证数据安全的?
https://blog.csdn.net/LiuYangCSND/article/details/118108565

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐