【工业化面试】之Redis zset是如何实现的?

时间:2024-04-07 18:34:09

1、什么是zset?

zset是 Redis五种数据结构中的一种(String、List、Hash、Set、Zset)。也称为sortedSet,它类似于Java里面是soretdSet和HashMap的结合体,因为它本身具有HashSet中不含重复元素的特性,又包含了SortedSet中内部有序的特性(通过传入一个score,根据score来排序)。但它内部的数据结构却与上述两种完全不同,它内部是通过一种名为 SkipList(跳跃表) 的数据结构来实现的。

2、什么是skipList?

SkipList是一种随机化的数据结构,是一种层次化的链表结构,它使得在进行增删改查时,都能在可接收的时间范围内完成操作。

【工业化面试】之Redis zset是如何实现的?
它的原理就是每次查找数据时,先在最上层查找,然后在定位到下一层,层层定位,最终找到目标数据,这种查找方式不用遍历整个链表,而是跳跃着查,这样就使得查找的时间复杂度退化到了logn(近似于二分查找),大大提高了查找效率。

一般来说,我们可以按下一层的链表来构造上一层的链表,举个例子,最下一层是所有数据构成的链表,我们将它分段,隔一个节点构造一个新的节点,这样,第二层的链表长度就是第一层的一半,第三层又是第二层的一半,以此类推。但是这里我们会发现一个严重的问题,每次对zset进行更新时,需要重新构建zset,这又增加了时间复杂度,所以zset在构建skiplist的时候,就给每个节点赋予了一个随机的层数,这样就避免了重新构建。

【工业化面试】之Redis zset是如何实现的?

3、为什么不使用List\红黑树或平衡二叉树呢?

我们知道,List是顺序存储,访问速度很快,但是添加和删除操作是一个(On)的操作,对于Redis这样要求高写入和高读取的数据库来说,List显然不能满足其要求。

至于红黑树和平衡二叉树,每次更新redis的值,都要调整树结构,这样会造成额外的开销,而跳跃表只需要调整表局部的链表结构就行,显然跳跃表更适合。

最后一个原因:跳跃表实现起来更简单:)

4、跳跃表的层数可以一直增加下去吗?

不能, 用数学的概念来解释,就是一个新建的节点有 50% 的概率被分配到 Level 1,25% 的概率被分配到 Level 2,12.5% 的概率被分配到 Level 3,以此类推…有 2-63的概率被分配到最顶层,因为这里每一层的晋升率都是 50%。只有当第一层节点数量达到是264时,也就是说层数到达32时,才可能被分到最顶层,因此,跳跃表的层数最大只能到达32层,这也被源码ZSKIPLIST_MAXLEVEL 定义了。