Trie字典树的学习及理解

时间:2024-04-23 21:35:24

字典树详解见

我这里学习时主要是看了李煜东的进阶指南里的讲解,以下是书中介绍的内容。

Trie,又称字典树,是一种用于实现字符串快速检索的多叉树结构,Tire的每个节点都拥有若干个字符指针,若在插入或检索字符串时扫描到一个字符c,就沿着当前节点的c这个字符指针,走向该指针指向的节点。

初始化时一颗空Trie仅包含一个根节点,该点的字符指针均指向空。

插入

当需要插入一个字符串s时,我们令一个指针p先指向根然后依次扫描s中的每个字符c:

1、若p的c字符指针指向一个已经存在的节点Q,则令p=Q。

2、若p的c字符指针指向空,则新建一个节点Q,令p的c字符指针指向Q,然后令p=Q。

当s中的字符扫描完毕时,在当前节点p上标记它是一个字符串的末尾。

检索

当需要检索一个字符串s在Trie中是否存在时,我们令一个指针p起初指向根节点,然后一次扫描s中的每个字符c:

1、若p的c字符指针指向空,则说明s没有被插入过Trie,结束检索。

2、若p的c字符指针指向一个已经存在的节点Q,令p=Q。

当s中的字符扫描完毕时,若当前节点p被标记为一个字符串的末尾,则说明s在Trie中存在,否则说明s没有被插入过Trie。

在Trie中,字符数据都体现在树的边(指针)上,树的节点仅保存一些额外的信息,例如单词结尾标记等。其空间复杂度为O(nc),其中n是节点个数,c是字符集的大小。

代码实现:

 // 假设字符串由小写字母构成
int trie[SIZE][], tot = ; // Trie的插入
void insert(char* str) {
int len = strlen(str), p = ;
for (int k = ; k < len; k++) {
int ch = str[k]-'a';
if (trie[p][ch] == ) trie[p][ch] = ++tot;
p = trie[p][ch];
}
end[p] = true;
} // Trie的检索
bool search(char* str) {
int len = strlen(str), p = ;
for (int k = ; k < len; k++) {
p = trie[p][str[k]-'a'];
if (p == ) return false;
}
return end[p];
}

相关文章