数据库索引引用树形结构 B-数 B+数

MySQL 为什么使用B+数

B-树和B+树最重要的一个区别就是B+树只有叶节点存放数据，其余节点用来索引，而B-树是每个索引节点都会有Data域。

这就决定了B+树更适合用来存储外部数据，也就是所谓的磁盘数据。
从Mysql（Inoodb）的角度来看，B+树是用来充当索引的，一般来说索引非常大，尤其是关系性数据库这种数据量大的索引能达到亿级别，所以为了减少内存的占用，索引也会被存储在磁盘上。
那么Mysql如何衡量查询效率呢？磁盘IO次数，B-树（B类树）的特定就是每层节点数目非常多，层数很少，目的就是为了就少磁盘IO次数，当查询数据的时候，最好的情况就是很快找到目标索引，然后读取数据，使用B+树就能很好的完成这个目的，但是B-树的每个节点都有data域（指针），这无疑增大了节点大小，说白了增加了磁盘IO次数（磁盘IO一次读出的数据量大小是固定的，单个数据变大，每次读出的就少，IO次数增多，一次IO多耗时啊！），而B+树除了叶子节点其它节点并不存储数据，节点小，磁盘IO次数就少。这是优点之一。
另一个优点是什么，B+树所有的Data域在叶子节点，一般来说都会进行一个优化，就是将所有的叶子节点用指针串起来。这样遍历叶子节点就能获得全部数据，这样就能进行区间访问啦。

(数据库索引采用B+树的主要原因是 B树在提高了磁盘IO性能的同时并没有解决元素遍历的效率低下的问题。正是为了解决这个问题，B+树应运而生。B+树只要遍历叶子节点就可以实现整棵树的遍历。而且在数据库中基于范围的查询是非常频繁的，而B树不支持这样的操作（或者说效率太低）)

MongoDB

至于MongoDB为什么使用B-树而不是B+树，可以从它的设计角度来考虑，它并不是传统的关系性数据库，而是以Json格式作为存储的nosql，目的就是高性能，高可用，易扩展。首先它摆脱了关系模型，上面所述的优点2需求就没那么强烈了，其次Mysql由于使用B+树，数据都在叶节点上，每次查询都需要访问到叶节点，而MongoDB使用B-树，所有节点都有Data域，只要找到指定索引就可以进行访问，无疑单次查询平均快于Mysql（但侧面来看Mysql至少平均查询耗时差不多）。

总体来说，Mysql选用B+树和MongoDB选用B-树还是以自己的需求来选择的。

前言

面试中我们经常碰到面试官问到数据库索引，问到索引就会问你索引的数据结构。类似这种数据结构对于普通程序员来说记住概念几天就忘了，而且概念不是每个人都能很好都理解，所以针对这一原因，我简单通俗都像大家讲解为什么mysql使用都是B+树，而不用其他的树形结构。

正文

Q1：B+树的查询时间大概多少？

A：跟树的高度有关，是O(log n)。

Q2：hash查找时间大概多少？

A：o（1）。

Q3：hash比B+查找时间更短，为什么索引不用hash？

A：这和业务场景有关，如果只查找一个值的话，hash是一个很好的选择，单数据库经常会选择多条，这时候由于B+树索引有序，并且又有链表相连，它的查询效率比hash就快很多了。而且数据库中的索引一般是在磁盘上，数据量大的情况可能无法一次装入内存，B+树的设计可以允许数据分批加载，同时树的高度较低，提高查找效率。

二叉排序树

同一高度下左边跟节点小，右边跟节点大，并且左右子树都是二叉排序的。但是在极端情况下插入的是有序的序列就会变成链表。

数据库索引引用树形结构 B-数 B+数

所以这时候我们就要对二叉树进行平衡，让插入的时候节点能均匀分布。

红黑树

性质1. 节点是红色或黑色。
性质2. 根节点是黑色。
性质3 每个叶节点（NIL节点，空节点）是黑色的。
性质4 每个红色节点的两个子节点都是黑色。(从每个叶子到根的所有路径上不能有两个连续的红色节点)
性质5. 从任一节点到其每个叶子的所有路径都包含相同数目的黑色节点。

所以引入红黑树，红黑树是平衡树的一种，他的复杂规则都是为了保证树的平衡，所以大家在记概念的时候理解不上去。

数据库索引引用树形结构 B-数 B+数

我们知道，树形结构的数据查找速度跟树的高度有关，所以尽可能让树平衡就是为了降低树的高度，java里有一种s数据结构底层就用的红黑树，就是TreeSet。

B树，也叫B-树，大家千万不要说B减树。

B树是一种多路搜索树，每个节点都可以有多于两个子节点，M路的B树就是有最多有M个子节点。

这就是一个3路B树

数据库索引引用树形结构 B-数 B+数

多路的结构就是为了尽可能降低树的高度，使查询速度更快，有一种情况就是无限多路，那就变成一个数组了，所以我们树ArrayList适合用来查询，数组结构的数据都有这个特点。

数据库索引引用树形结构 B-数 B+数

所以我们常常用B树做文件系统的索引，因为我们文件和数据库的索引都是存在硬盘上的，并且如果数据量大的话，不一定能一次性加载到内存中。所以一棵树无法全部加载到内存里我们怎么查找，这时候就用到我们刚才说到的B树了，我们可以每次加载树的每一个节点，然后一步一步往下查找，而且多路B树每个节点会多于两个子节点，速度会更快，所以我们不用红黑树，因为红黑树子节点只有两个。

数据库索引引用树形结构 B-数 B+数

B+树

B+树是在B树基础上改造的，他的数据都在叶子节点，同时叶子节点还加了指针。

这是一个四路B+树，叶子节点都数据形成了链表

数据库索引引用树形结构 B-数 B+数

这也是和业务场景相关的，你想想，数据库中select数据，不一定只选一条，很多时候会选多条，比如按照id排序后选10条。如果是多条的话，B树需要做局部的中序遍历，可能要跨层访问。而B+树由于所有数据都在叶子结点，不用跨层，同时由于有链表结构，只需要找到首尾，通过链表就能把所有数据取出来了。

比如我们查找7到19，B+ 都威力看到了吧。所以小伙伴们回到前文都三个问题中，就知道了为什么MySql索引使用B+树了吧。

数据库索引引用树形结构 B-数 B+数

数据库索引 引用树形结构 B-数 B+数

前言

正文

数据库索引引用树形结构 B-数 B+数