从缓存的本质说起，说服技术大佬用Redis

在技术领域中，没有银弹。我们需要不断探索和研究新的技术，结合具体问题和需求，选择最适合的解决方案。

华为云开发者联盟

787人浏览 · 2023-05-10 16:57:39

华为云开发者联盟 · 2023-05-10 16:57:39 发布

摘要：在技术领域中，没有银弹。我们需要不断探索和研究新的技术，结合具体问题和需求，选择最适合的解决方案。

本文分享自华为云社区《知乎问题：如何说服技术老大用 Redis ？》，作者：勇哥java实战分享。

最近在某问答平台看到一个技术讨论：如何说服技术老大用Redis?

“他总觉得用Redis每次都要去请求，肯定是没有加载内存里快，项目一直是搞个map装下要缓存的数据，一个定时任务去刷新这个map……”

这个问题很微妙，可能这位同学内心深处，觉得 Redis 是所有应用缓存的标配。

缓存的世界很广阔，对于应用系统来讲，我们经常将缓存划分为本地缓存和分布式缓存。

本地缓存 ：应用中的缓存组件，缓存组件和应用在同一进程中，缓存的读写非常快，没有网络开销。但各应用或集群的各节点都需要维护自己的单独缓存，无法共享缓存。

分布式缓存：和应用分离的缓存组件或服务，与本地应用隔离，多个应用可直接共享缓存。

1 缓存的本质

我们常常会讲：“加了缓存，我们的系统就会更快” 。

所谓的“更快”，本质上做到了如下两点：

减小 CPU 消耗

将原来需要实时计算的内容提前算好、把一些公用的数据进行复用，这可以减少 CPU 消耗，从而提升响应性能。
减小 I/O 消耗

将原来对网络、磁盘等较慢介质的读写访问变为对内存等较快介质的访问，从而提升响应性能。

假如可以通过增强 CPU、I/O 本身的性能来满足需求的话，升级硬件往往是更好的解决方案，即使需要一些额外的投入成本，也通常要优于引入缓存后可能带来的风险。

从开发角度来说，引入缓存会提高系统复杂度，因为你要考虑缓存的失效、更新、一致性等问题。

从运维角度来说，缓存会掩盖掉一些缺陷，让问题在更久的时间以后，出现在距离发生现场更远的位置上。

从安全角度来说，缓存可能泄漏某些保密数据，也是容易受到攻击的薄弱点。

因此，缓存是把双刃剑。

2 本地缓存 JDK Map

JDK Map 经常用于缓存实现：

HashMap

HashMap 是一种基于哈希表的集合类，它提供了快速的插入、查找和删除操作。可以将键值对作为缓存项的存储方式，将键作为缓存项的唯一标识符，值作为缓存项的内容。
ConcurrentHashMap

ConcurrentHashMap 是线程安全的 HashMap，它在多线程环境下可以保证高效的并发读写操作。
LinkedHashMap

LinkedHashMap 是一种有序的 HashMap ，它保留了元素插入的顺序，可以按照插入顺序或者访问顺序进行遍历。
TreeMap

TreeMap 是一种基于红黑树的有序 Map，它可以按照键的顺序进行遍历。

笔者曾经负责艺龙红包系统，红包活动就是存储在 ConcurrentHashMap 中，通过定时任务刷新缓存 。

核心流程：

1、红包系统启动后，初始化一个 ConcurrentHashMap 作为红包活动缓存；

2、数据库查询所有的红包活动 , 并将活动信息存储在 Map 中 ;

3、定时任务每隔 30 秒，执行缓存加载方法，刷新缓存。

为什么红包系统会将红包活动信息存储在本地内存 ConcurrentHashMap 呢？

红包系统是高并发应用，快速将请求结果响应给前端，大大提升用户体验；
红包活动数量并不多，就算全部放入到 Map 里也不会产生内存溢出的问题；
定时任务刷新缓存并不会影响红包系统的业务。

笔者见过很多单体应用都使用这种方案，该方案的特点是简洁易用，工程实现也容易。

3 本地缓存框架

虽然使用 JDK Map 能快捷构建缓存，但缓存的功能还是比较孱弱的。

因为现实场景里，我们可能需要给缓存添加缓存统计、过期失效、淘汰策略等功能。

于是，本地缓存框架应运而生。

流行的 Java 缓存框架包括： Ehcache , Google Guava , Caffine Cache 。

下图展示了 Caffine 框架的使用示例。

虽然本地缓存框架的功能很强大，但是本地缓存的缺陷依然明显。

1、高并发的场景，应用重启之后，本地缓存就失效了，系统的负载就比较大，需要花较长的时间才能恢复；

2、每个应用节点都会维护自己的单独缓存，缓存同步比较头疼。

4 分布式缓存

分布式缓存是指将缓存数据分布在多台机器上，以提高缓存容量和并发读写能力的缓存系统。分布式缓存通常由多台机器组成一个集群，每台机器上都运行着相同的缓存服务进程，缓存数据被均匀地分布在集群中的各个节点上。

Redis 是分布式缓存的首选，甚至我们一提到缓存，很多后端工程师首先想到的就它。

下图是神州专车订单的 Redis 集群架构。将 Redis 集群拆分成四个分片，每个分片包含一主一从，主从可以切换。应用 A 根据不同的缓存 key 访问不同的分片。

与本地缓存相比，分布式缓存具有以下优点：

1、容量和性能可扩展

通过增加集群中的机器数量，可以扩展缓存的容量和并发读写能力。同时，缓存数据对于应用来讲都是共享的。

2、高可用性

由于数据被分布在多台机器上，即使其中一台机器故障，缓存服务也能继续提供服务。

但是分布式缓存的缺点同样不容忽视。

1、网络延迟

分布式缓存通常需要通过网络通信来进行数据读写，可能会出现网络延迟等问题，相对于本地缓存而言，响应时间更长。

2、复杂性

分布式缓存需要考虑序列化、数据分片、缓存大小等问题，相对于本地缓存而言更加复杂。

笔者曾经也认为无脑上缓存，系统就一定更快，但直到一次事故，对于分布式缓存的观念才彻底改变。

2014年，同事开发了比分直播的系统，所有的请求都是从分布式缓存 Memcached 中获取后直接响应。常规情况下，从缓存中查询数据非常快，但在线用户稍微多一点，整个系统就会特别卡。

通过 jstat 命令发现 GC 频率极高，几次请求就将新生代占满了，而且 CPU 的消耗都在 GC 线程上。初步判断是缓存值过大导致的，果不其然，缓存大小在 300k 到 500k 左右。

解决过程还比较波折，分为两个步骤：

修改新生代大小，从原来的 2G 修改成 4G，并精简缓存数据大小 (从平均 300k 左右降为 80k 左右)；
把缓存拆成两个部分，第一部分是全量数据，第二部分是增量数据（数据量很小）。页面第一次请求拉取全量数据，当比分有变化的时候，通过 websocket 推送增量数据。

经过这次优化，笔者理解到：缓存虽然可以提升整体速度，但是在高并发场景下，缓存对象大小依然是需要关注的点，稍不留神就会产生事故。另外我们也需要合理地控制读取策略，最大程度减少 GC 的频率 , 从而提升整体性能。