存储引擎-Buffered tree

Buffered-tree 也称为COLA，即cache-oblivious，可以不需要知道具体内存大小和一个块的大小，使用一套逻辑进行处理，因此内存大小可知，内存可能被临时占用去做其它事情。

Buffered-tree典型的实现是TokuDB，在里面被称为Fractal-tree。

其算法的基本过程为：

存储引擎-Buffered tree

　　3. 如果再写入一个值“11”，因为第一行已经写满，所以将“3”取出，和“11”排序，尝试写入第二行。又因为第二行也定满了，所以将第二行取出，对“3”，“11”，“5”，“10”进行排序，写入第四行。结果如下图所示。

存储引擎-Buffered tree

从上面操作过程可知，Buffered-tree与LSM的思想类似，每次将数据从上一层取出，与外部数据进行归并后写入新的队列中。这对SAS磁盘非常友好，对磁盘的写入性能有很大的提升。

为了提高查询速度，在合并的时候，上层需要持有下层数据的指针。因此最后的结构如下图：

存储引擎-Buffered tree

关于B-tree，Append-file，Buffered-tree三种读写方式的算法复杂度为：

存储引擎-Buffered tree

举例说明损耗：

对于100W 个128字节。N = 2^30；log(N) = 30；

磁盘中1MB数据块有8192个数据，B = 8192；logB = 13；

存储引擎-Buffered tree

结论：Buffered-tree对IO的使用远远小于B树。

秒客网