redis的压缩列表和跳表，看这一篇文章就够了

说到redis，大家的第一印象就是它快，它接收到一个键值对操作后，能以微秒级别的速度找到数据，并快速完成操作。我们知道redis是内存数据库，所有的操作都是在内存上实现的，这是它快的一个重要原因，那么，它另外一个重要原因就是redis高效的数据结构设计，下面我们一起来学习一下。简单来说，底层数据结构一共有 6 种，分别是简单动态字符串、双向链表、压缩列表、哈希表、跳表和整数数组。它们和数据类型的对

李孛欢

2659人浏览 · 2022-05-19 14:03:57

李孛欢 · 2022-05-19 14:03:57 发布

说到redis，大家的第一印象就是它快，它接收到一个键值对操作后，能以微秒级别的速度找到数据，并快速完成操作。我们知道redis是内存数据库，所有的操作都是在内存上实现的，这是它快的一个重要原因，那么，它另外一个重要原因就是redis高效的数据结构设计，下面我们一起来学习一下。

简单来说，底层数据结构一共有 6 种，分别是简单动态字符串、双向链表、压缩列表、哈希表、跳表和整数数组。它们和数据类型的对应关系如下图所示：

可以看到有三种数据类型底层使用了压缩列表：List，Hash，Sorted Set（有序集合）。另外Sorted Set 还使用了跳表这一数据结构。下面我们来详细分析一下这两种数据结构。

一. 跳表

跳表（skiplists）是一种有序的数据结构，它通过在每个节点中维持多个指向其他的节点指针，从而达到快速访问队尾目的。

跳表的原理如图所示，由 William Pugh 在Skip Lists: A Probabilistic Alternative to Balanced Trees论文中提出，是一种可以于平衡树媲美的层次化链表结构——查找、删除、添加等操作都可以在对数期望时间下完成。

可以看到，从a到e跳表的层级越来越多，查询速度也会相应变快。我们查询的时候，是从上往下开始查找。这个查找过程就是在多级索引上跳来跳去，最后定位到元素。这也正好符合“跳”表的叫法。当数据量很大时，跳表的查找复杂度就是 O(logN)。

二. 压缩列表

听到“压缩”两个字，直观的反应就是节省内存。之所以说这种存储结构节省内存,是相较于数组的存储思路而言的。我们知道,数组要求每个元素的大小相同,如果我们要存储不同长度的字符串,那我们就需要用最大长度的字符串大小作为元素的大小(假设是20个字节)。存储小于 20 个字节长度的字符串的时候，便会浪费部分存储空间。