linux 内核数据结构之 avl树.

时间:2024-05-26 23:04:02

转载:

http://blog.****.net/programmingring/article/details/37969745

https://zh.wikipedia.org/wiki/AVL%E6%A0%91

理解avl树,首先需要理解二叉搜索树:

http://www.cnblogs.com/skywang12345/p/3576328.html

写在前面的话: 

  linux 内核中数据结构的存储已经不在用avl树,我在对应的代码中也没有找到实现,应该是内核中全部用rbtree替换了.zebos中avl树的实现相对较复杂,考虑了临时缓冲等多种因素,不适合作为初学者理解avl树的入门代码,因此,在网络上找到两篇姐姐avl树的文章,讲的很透彻了,以此作入门.理解其它avl树的代码应该很容易了.

正文理解:

AVL树的介绍

AVL树是根据它的发明者G.M. Adelson-Velsky和E.M. Landis命名的。
它是最先发明的自平衡二叉查找树,也被称为高度平衡树。相比于"二叉查找树",它的特点是:AVL树中任何节点的两个子树的高度最大差别为1。 

linux 内核数据结构之 avl树.

上面的两张图片,左边的是AVL树,它的任何节点的两个子树的高度差别都<=1;而右边的不是AVL树,因为7的两颗子树的高度相差为2(以2为根节点的树的高度是3,而以8为根节点的树的高度是1)。

AVL树的查找、插入和删除在平均和最坏情况下都是O(logn)。
如果在AVL树中插入或删除节点后,使得高度之差大于1。此时,AVL树的平衡状态就被破坏,它就不再是一棵二叉树;为了让它重新维持在一个平衡状态,就需要对其进行旋转处理。学AVL树,重点的地方也就是它的旋转算法;在后文的介绍中,再来对它进行详细介绍。

AVL树的C实现

1. 节点

1.1 定义

 typedef int Type;

 typedef struct AVLTreeNode{
Type key; // 关键字(键值)
int height;
struct AVLTreeNode *left; // 左孩子
struct AVLTreeNode *right; // 右孩子
}Node, *AVLTree;

AVL树的节点包括的几个组成对象:
(01) key -- 是关键字,是用来对AVL树的节点进行排序的。
(02) left -- 是左孩子。
(03) right -- 是右孩子。
(04) height -- 是高度。

1.2 节点的创建

 /*
* 创建AVL树结点。
*
* 参数说明:
* key 是键值。
* left 是左孩子。
* right 是右孩子。
*/
static Node* avltree_create_node(Type key, Node *left, Node* right)
{
Node* p; if ((p = (Node *)malloc(sizeof(Node))) == NULL)
return NULL;
p->key = key;
p->height = ;
p->left = left;
p->right = right; return p;
}

1.3 树的高度

 #define HEIGHT(p)    ( (p==NULL) ? 0 : (((Node *)(p))->height) )

 /*
* 获取AVL树的高度
*/
int avltree_height(AVLTree tree)
{
return HEIGHT(tree);
}

关于高度,有的文章中将"空二叉树的高度定义为-1",而本文采用*上的定义:树的高度为最大层次。即空的二叉树的高度是0,非空树的高度等于它的最大层次(根的层次为1,根的子节点为第2层,依次类推)。

1.4 比较大小

 #define MAX(a, b)    ( (a) > (b) ? (a) : (b) 

2. 旋转

AVL树的基本操作一般涉及运作同在不平衡的二叉查找树所运作的同样的算法。但是要进行预先或随后做一次或多次所谓的"AVL旋转"。

以下图表以四列表示四种情况,每行表示在该种情况下要进行的操作。在左左和右右的情况下,只需要进行一次旋转操作;在左右和右左的情况下,需要进行两次旋转操作。

linux 内核数据结构之 avl树.

通过上图可以知道,如果在AVL树中进行插入或删除节点后,可能导致AVL树失去平衡。这种失去平衡的可以概括为4种姿态:LL(左左),LR(左右),RR(右右)和RL(右左)。需要说明的是,下面的内容只给出在这四中情况下如何进行旋转使得avl树达到新的平衡,以帮助读者理解avl树的代码,内容不会涉及具体这样的原因,你只需要知道,看,我进行这样操作后,会重新得到一个二叉平衡搜索树。下面给出它们的示意图:

linux 内核数据结构之 avl树.

上图中的4棵树都是"失去平衡的AVL树",从左往右的情况依次是:LL、LR、RL、RR。总的来说,AVL树失去平衡时的情况一定是LL、LR、RL、RR这4种之一,它们都由各自的定义:

(1) LL:LeftLeft,也称为"左左"。插入或删除一个节点后,根节点的左子树的左子树还有非空子节点,导致"根的左子树的高度"比"根的右子树的高度"大2,导致AVL树失去了平衡。
     例如,在上面LL情况中,由于"根节点(8)的左子树(4)的左子树(2)还有非空子节点",而"根节点(8)的右子树(12)没有子节点";导致"根节点(8)的左子树(4)高度"比"根节点(8)的右子树(12)"高2。

(2) LR:LeftRight,也称为"左右"。插入或删除一个节点后,根节点的左子树的右子树还有非空子节点,导致"根的左子树的高度"比"根的右子树的高度"大2,导致AVL树失去了平衡。
     例如,在上面LR情况中,由于"根节点(8)的左子树(4)的左子树(6)还有非空子节点",而"根节点(8)的右子树(12)没有子节点";导致"根节点(8)的左子树(4)高度"比"根节点(8)的右子树(12)"高2。

(3) RL:RightLeft,称为"右左"。插入或删除一个节点后,根节点的右子树的左子树还有非空子节点,导致"根的右子树的高度"比"根的左子树的高度"大2,导致AVL树失去了平衡。
     例如,在上面RL情况中,由于"根节点(8)的右子树(12)的左子树(10)还有非空子节点",而"根节点(8)的左子树(4)没有子节点";导致"根节点(8)的右子树(12)高度"比"根节点(8)的左子树(4)"高2。

(4) RR:RightRight,称为"右右"。插入或删除一个节点后,根节点的右子树的右子树还有非空子节点,导致"根的右子树的高度"比"根的左子树的高度"大2,导致AVL树失去了平衡。
     例如,在上面RR情况中,由于"根节点(8)的右子树(12)的右子树(14)还有非空子节点",而"根节点(8)的左子树(4)没有子节点";导致"根节点(8)的右子树(12)高度"比"根节点(8)的左子树(4)"高2。

前面说过,如果在AVL树中进行插入或删除节点后,可能导致AVL树失去平衡。AVL失去平衡之后,可以通过旋转使其恢复平衡,下面分别介绍"LL(左左),LR(左右),RR(右右)和RL(右左)"这4种情况对应的旋转方法。

avl树的旋转,核心思想在旋转这一节的第一张图中表达的已经很清楚了,无论是左旋还是右旋(实质上只有两种旋转),在写函数代码的时候,函数的形参是失去平很的根节点root,函数的具体实现内容是,失去平衡的根节点root围绕着平衡后的根节点 pivot进行相应的旋转操作。

LL失去平衡的情况,可以通过一次旋转让AVL树恢复平衡。如下图:

linux 内核数据结构之 avl树.

图中左边是旋转之前的树,右边是旋转之后的树。从中可以发现,旋转之后的树又变成了AVL树,而且该旋转只需要一次即可完成。

LL的旋转代码

 /*
* LL:左左对应的情况(右单旋转)。
*
* 返回值:旋转后的根节点
*/
static Node* left_left_rotation(AVLTree k2)
{
AVLTree k1; k1 = k2->left;
k2->left = k1->right;
k1->right = k2; k2->height = MAX( HEIGHT(k2->left), HEIGHT(k2->right)) + ;
k1->height = MAX( HEIGHT(k1->left), k2->height) + ; return k1;
}

我感觉上面函数名字起得有问题,应该叫做left_left_situation或者right_rotation,因为实际上,对于LL的情形来说,实际上对应的是右旋转:即传入的形参是失去平衡的根节点,函数的内容是失去平衡的根节点root围绕着重新平衡后的根节点pivot进行右旋转操作。

2.2 RR的旋转

理解了LL之后,RR就相当容易理解了。RR是与LL对称的情况!RR恢复平衡的旋转方法如下:

linux 内核数据结构之 avl树.

图中左边是旋转之前的树,右边是旋转之后的树。RR旋转也只需要一次即可完成。

RR的旋转代码

/*
* RR:右右对应的情况(左单旋转)。
*
* 返回值:旋转后的根节点
*/
static Node* right_right_rotation(AVLTree k1)
{
AVLTree k2; k2 = k1->right;
k1->right = k2->left;
k2->left = k1; k1->height = MAX( HEIGHT(k1->left), HEIGHT(k1->right)) + 1;
k2->height = MAX( HEIGHT(k2->right), k1->height) + 1; return k2;
}

我感觉上面函数名字起得有问题,应该叫做right_right_situation或者left_rotation,因为实际上,对于RR的情形来说,实际上对应的是左旋转:即传入的形参是失去平衡的根节点,函数的内容是失去平衡的根节点root围绕着重新平衡后的根节点pivot进行左旋转操作。 

2.3 LR的旋转

LR失去平衡的情况,需要经过两次旋转才能让AVL树恢复平衡。如下图

linux 内核数据结构之 avl树.

第一次旋转是围绕"k1"进行的"RR旋转",第二次是围绕"k3"进行的"LL旋转"。

LR的旋转代码

 /*
* LR:左右对应的情况(左双旋转)。
*
* 返回值:旋转后的根节点
*/
static Node* left_right_rotation(AVLTree k3)
{
k3->left = right_right_rotation(k3->left); return left_left_rotation(k3);
}
复制代码

左右旋转的情况结合本节第一张图最好理解。

2.4 RL的旋转
RL是与LR的对称情况!RL恢复平衡的旋转方法如下:

linux 内核数据结构之 avl树.

RL的情况结合本节第一张图最好理解。

 /*
* RL:右左对应的情况(右双旋转)。
*
* 返回值:旋转后的根节点
*/
static Node* right_left_rotation(AVLTree k1)
{
k1->right = left_left_rotation(k1->right); return right_right_rotation(k1);
}

3. 插入

插入节点的代码

 /*
* 将结点插入到AVL树中,并返回根节点
*
* 参数说明:
* tree AVL树的根结点
* key 插入的结点的键值
* 返回值:
* 根节点
*/
Node* avltree_insert(AVLTree tree, Type key)
{
if (tree == NULL)
{
// 新建节点
tree = avltree_create_node(key, NULL, NULL);
if (tree==NULL)
{
printf("ERROR: create avltree node failed!\n");
return NULL;
}
}
else if (key < tree->key) // 应该将key插入到"tree的左子树"的情况
{
tree->left = avltree_insert(tree->left, key);
// 插入节点后,若AVL树失去平衡,则进行相应的调节。
if (HEIGHT(tree->left) - HEIGHT(tree->right) == )
{
if (key < tree->left->key)
tree = left_left_rotation(tree);
else
tree = left_right_rotation(tree);
}
}
else if (key > tree->key) // 应该将key插入到"tree的右子树"的情况
{
tree->right = avltree_insert(tree->right, key);
// 插入节点后,若AVL树失去平衡,则进行相应的调节。
if (HEIGHT(tree->right) - HEIGHT(tree->left) == )
{
if (key > tree->right->key)
tree = right_right_rotation(tree);
else
tree = right_left_rotation(tree);
}
}
else //key == tree->key)
{
printf("添加失败:不允许添加相同的节点!\n");
} tree->height = MAX( HEIGHT(tree->left), HEIGHT(tree->right)) + ; return tree;
}

4. 删除

删除节点的代码

 /*
* 删除结点(z),返回根节点
*
* 参数说明:
* ptree AVL树的根结点
* z 待删除的结点
* 返回值:
* 根节点
*/
static Node* delete_node(AVLTree tree, Node *z)
{
// 根为空 或者 没有要删除的节点,直接返回NULL。
if (tree==NULL || z==NULL)
return NULL; if (z->key < tree->key) // 待删除的节点在"tree的左子树"中
{
tree->left = delete_node(tree->left, z);
// 删除节点后,若AVL树失去平衡,则进行相应的调节。
if (HEIGHT(tree->right) - HEIGHT(tree->left) == )
{
Node *r = tree->right;
if (HEIGHT(r->left) > HEIGHT(r->right))
tree = right_left_rotation(tree);
else
tree = right_right_rotation(tree);
}
}
else if (z->key > tree->key)// 待删除的节点在"tree的右子树"中
{
tree->right = delete_node(tree->right, z);
// 删除节点后,若AVL树失去平衡,则进行相应的调节。
if (HEIGHT(tree->left) - HEIGHT(tree->right) == )
{
Node *l = tree->left;
if (HEIGHT(l->right) > HEIGHT(l->left))
tree = left_right_rotation(tree);
else
tree = left_left_rotation(tree);
}
}
else // tree是对应要删除的节点。
{
// tree的左右孩子都非空
if ((tree->left) && (tree->right))
{
if (HEIGHT(tree->left) > HEIGHT(tree->right))
{
// 如果tree的左子树比右子树高;
// 则(01)找出tree的左子树中的最大节点
// (02)将该最大节点的值赋值给tree。
// (03)删除该最大节点。
// 这类似于用"tree的左子树中最大节点"做"tree"的替身;
// 采用这种方式的好处是:删除"tree的左子树中最大节点"之后,AVL树仍然是平衡的。
Node *max = avltree_maximum(tree->left);
tree->key = max->key;
tree->left = delete_node(tree->left, max);
}
else
{
// 如果tree的左子树不比右子树高(即它们相等,或右子树比左子树高1)
// 则(01)找出tree的右子树中的最小节点
// (02)将该最小节点的值赋值给tree。
// (03)删除该最小节点。
// 这类似于用"tree的右子树中最小节点"做"tree"的替身;
// 采用这种方式的好处是:删除"tree的右子树中最小节点"之后,AVL树仍然是平衡的。
Node *min = avltree_maximum(tree->right);
tree->key = min->key;
tree->right = delete_node(tree->right, min);
}
}
else
{
Node *tmp = tree;
tree = tree->left ? tree->left : tree->right;
free(tmp);
}
} return tree;
} /*
* 删除结点(key是节点值),返回根节点
*
* 参数说明:
* tree AVL树的根结点
* key 待删除的结点的键值
* 返回值:
* 根节点
*/
Node* avltree_delete(AVLTree tree, Type key)
{
Node *z; if ((z = avltree_search(tree, key)) != NULL)
tree = delete_node(tree, z);
return tree;
}

好了,avl树重点到此结束,后面的内容参考原文吧。

原文链接:http://blog.****.net/programmingring/article/details/37969745