Zookeeper到底是AP还是CP？

1.结论：Zookeeper实现了A可用性、P分区容错性、C中的写入强一致性，丧失的是C中的读取一致性，读取准确地说是顺序一致性主要有以下三点：从一个读写请求分析，保证了可用性（不用阻塞等待全部follwer同步完成），保证不了数据的一致性，所以是ap。从zk架构分析，zk在leader选举期间，会暂停对外提供服务（为啥会暂停，因为zk依赖leader来保证数据一致性)，所以丢失了可用性，保证了一

Aaron_Wjf

8766人浏览 · 2021-08-27 05:57:54

Aaron_Wjf · 2021-08-27 05:57:54 发布

1.结论：

Zookeeper实现了A可用性、P分区容错性、C中的写入强一致性，丧失的是C中的读取一致性，读取准确地说是顺序一致性
主要有以下三点：

从一个读写请求分析，保证了可用性（不用阻塞等待全部follwer同步完成），保证不了数据的一致性，所以是ap。
从zk架构分析，zk在leader选举期间，会暂停对外提供服务（为啥会暂停，因为zk依赖leader来保证数据一致性)，所以丢失了可用性，保证了一致性。
进一步讲：这个c不是强一致性，而是最终一致性。即上面的写案例，数据最终会同步到一致，只是时间问题。

2.Zookeeper写入流程

首先client向zk Server发出一个写的请求，如果当前server不是Leader，那会把请求发送给Leader；
Leader接收到以后开始发起Proposal到Follwer，不对Observer发送；
Follower收到来自Leader的提议后，会返回ack响应；
Leader收到ack请求后，会采用过半机制，即发送出去的提议有一半以上的ack响应，则就会发送commit提交数据，同时也会向Observer提交commit；
返回给客户端写入成功的回应；
若有新的服务器加入进来，也会对Leader进行数据同步，来达到集群中数据的一致性。

3.Zookeeper读取流程

Client 向Zookeeper 发出读请求之后，无论请求的是Leader 还是 Follower ，都将会直接返回结果，如果使用sync读取，异步的实现当前进程与leader之间的指定path的数据同步，这样能读到最新的数据。

4.Zookeeper会脏读吗？

会的，如果一个zk集群有10000台节点，当进行写入的时候，如果已经有6K个节点写入成功，zk就认为本次写请求成功。但是这时候如果一个客户端读取的刚好是另外4K个节点的数据，那么读取到的就是旧的过期数据。

ZooKeeper并不保证在每个实例中，两个不同的客户端将具有相同的ZooKeeper数据的视图。由于诸如网络延迟的因素，一个客户端可以在另一客户端被通知该改变之前执行更新，考虑两个客户端A和B的场景。如果客户端A将znode / a的值从0设置为1，则告诉客户端B读取/ a，则客户端B可以读取旧值0，这取决于它连接到的服务器。如果客户端A和客户端B读取相同的值很重要，则客户端B应该在执行读取之前从ZooKeeper API方法调用sync()方法。