如何解决缓存与数据库不一致？

目录一、概要二、场景一：先更新数据库，再更新缓存三、场景二：先更新缓存，再更新数据库四、场景三：先删除缓存，再更新数据库五、场景四：先更新数据库，再删除缓存六、场景五：数据库主从同步导致数据不一致七、总结一、概要缓存跟数据库不一致，指的是缓存中的数据跟数据库的数据出现了不一致，即其中一方存在脏数据的现象。需要注意的是，只有在对同一条数据并发读写的时候，才可能会出现这种问题。如果系统并发量很低，特别

每天都要进步一点点

4534人浏览 · 2021-11-15 20:48:06

每天都要进步一点点 · 2021-11-15 20:48:06 发布

一、概要

缓存跟数据库不一致，指的是缓存中的数据跟数据库的数据出现了不一致，即其中一方存在脏数据的现象。需要注意的是，只有在对同一条数据并发读写的时候，才可能会出现这种问题。

如果系统并发量很低，特别是读并发很低，那么它发生缓存跟数据库数据不一致的情况相对比较少，概率比较低；
如果系统并发量很高，像淘宝、京东等电商平台，每天都是上亿级流量，每秒并发读是几万，每秒都有写请求，这种情况下出现缓存跟数据库不一致的概率就比较高；

下面我们详细分析常见的发生缓存与数据库不一致的场景。

二、场景一：先更新数据库，再更新缓存

假设有 2 个线程A 、B并发「写」id = 1的user数据，在高并发下可能会发生以下场景：

线程A更新数据库（name = 李四)：update user set name = '李四' where id = 1；
线程B更新数据库（name = 王五)：update user set name = '王五' where id = 1；
线程B更新缓存（name = 王五）；
线程A更新缓存（name = 李四）；

可以看到，线程B操作数据库和缓存的时间，却要比线程A的时间短，执行时序发生了「错乱」，此时线程B对缓存的更新就被覆盖掉了，最终导致id = 1的用户user的值在缓存中是"李四"，在数据库中是"王五"，缓存和数据库数据发生不一致。可见，先更新数据库，再更新缓存，当发生「写」并发时，也会存在数据不一致的情况。

大体过程如下图所示：

实际项目中通常不采用这种方式，主要基于如下一些原因：

线程安全问题

如上分析的执行时序发生「错乱」，最终这条数据的结果是错误的，缓存跟数据库中其中一方的数据是脏数据。

性能问题

如果采用先更新数据库，再更新缓存的方式，假如我们的系统写数据比较多，而读操作比较少，那么缓存将会被频繁地更新，这样导致缓存中的数据压根就没被读请求利用上，浪费性能。

三、场景二：先更新缓存，再更新数据库

这个比较简单，假设线程A需要写数据，如执行update user set name = '李四' where id = 1，此时线程A先更新缓存数据为"李四"，然后更新数据库的时候，抛异常了，失败了，导致缓存更新成功，数据库更新失败，这就造成了两者的不一致，此时如果刚好有一个线程过来读数据：select * from user where id = 1，那么从缓存中读取到的数据就是脏数据。

实际项目中通常不采用更新缓存的方式，而采用删除缓存的方式。