【文件属性】:
文件名称:kaldi中的关键词检索-基于xilinx fpga的sata3.0 ip核
文件大小:1.34MB
文件格式:PDF
更新时间:2021-06-08 13:21:10
kaldi 语音识别
4.6 kaldi中的关键词检索
(@刘诗涵翻译)
Keyword Search in Kaldi
Introduction
本部分主要对 kaldi中关键字搜索模块的内容做相关介绍。我们会简要介绍在论
文 "Lattice indexing for spoken term detection", D. Can, M. Saraclar, Audio,
Speech, and Language Processing 中提出的关键字搜索算法,但是这里会着重
介绍搜索算法的具体实现过程以及我们对算法做的一些延伸。
Lattice Indexing
在此我们只是简单的介绍一下算法,如果想了解更多的细节,你可以去查看相关
网格索引(lattice indexing)的文章。
Related Semiring
索引算法是基于一种特殊设计的半环(semiring),此种半环可以同时存储时间和
权重(置信度)的信息。强烈建议读者去仔细阅读理解半环的详细定义,但是以
防读者忘记相关概念,我们在此对其进行简单回顾:
定义 1:幺半群(注 monoid: 幺半群是指一个带有可结合二元运算和单位元的代
数结构)是一个三元组
k ,,1
,其中是在数据集 k上的一个封闭的二元结
合运算,1是中的单位元。如果二元运算在数据集 k是可交换的那么此幺半
群也是可交换的。
定义 2:半环(semiring:在抽象代数中,半环是类似于环但没有加法逆元的代
数结构)是一个五元组
k , ,,0,1
,并且符合如下条件:
1. k ,,1 是一个幺半群;
2. k , ,0,是一个可交换幺半群;
3.对符合分配率,即
, , , aa b c k a b c a b a c b c a c b c 且
;
,a k a a 0 0 0
下面介绍在算法中使用到的 5种半环(semiring):
对数半环(Log semiring):对数半环(Log semiring)的定义如下:
logL= R - + + + 0 , , ,, , ,
版
权
所
有
翻
版
必
究