• 语音识别之Kaldi学习GMM-HMM

    时间:2022-12-08 08:51:56

    语音识别之Kaldi kaldi语音识别理论与实践课程学习。 前面的博客介绍了语音识别的基础知识及原理。现在开始学习实战。以Kaldi框架为基础。 Kaldi是一个有全套的语音识别代码的工具,由Dan Povey博士和捷克的BUT大学联合开发,最早发布于2011年,底层代码使用C++编写,接口采用s...

  • 语音识别传统方法(GMM+HMM+NGRAM)概述

    时间:2022-10-28 18:01:37

    春节后到现在近两个月了,没有更新博客,主要是因为工作的关注点正从传统语音(语音通信)转向智能语音(语音识别)。部门起了个新项目,要用到语音识别(准备基于Kaldi来做)。我们之前做的传统音频已基本成熟,就开始关注在语音识别上了。对于我们来说,这是个全新的领域(虽然都是语音相关的,但是语音通信偏信号处...

  • 高斯混合模型(GMM)

    时间:2022-09-23 23:12:24

    复习:1.概率密度函数,密度函数,概率分布函数和累计分布函数概率密度函数一般以大写“PDF”(Probability Density Function),也称概率分布函数,有的时候又简称概率分布函数。 而累计分布函数是概率分布函数的积分。 注意区分从数学上看,累计分布函数F(x)=P(X<x)...

  • 机器学习&数据挖掘笔记_14(GMM-HMM语音识别简单理解)

    时间:2022-09-19 15:47:42

    为了对GMM-HMM在语音识别上的应用有个宏观认识,花了些时间读了下HTK(用htk完成简单的孤立词识别)的部分源码,对该算法总算有了点大概认识,达到了预期我想要的。不得不说,网络上关于语音识别的通俗易懂教程太少,都是各种公式满天飞,很少有说具体细节的,当然了,那需要有实战经验才行。下面总结以下几点...

  • 04(1) 基于上下文相关的GMM-HMM声学模型1

    时间:2021-11-11 12:19:02

    1.上下文对音素发音的语谱轨迹的影响受到上下文的影响,同一个音素的发音语谱轨迹不同为提高识别准确率,对音素建模时应将这种上下文影响考虑在内2.基于上下文相关的音素建模注意,非单音素建模中,每个模型依旧代表一个音素,只是考虑了这个音素的上下文关系而已1)双音素diphones考虑上个音素/下个音素对当...

  • EM算法(2):GMM训练算法

    时间:2021-10-17 02:22:26

    目录EM算法(1):K-means算法EM算法(2):GMM训练算法EM算法(3):EM算法运用EM算法(4):EM算法证明EM算法(2):GMM训练算法1.简介GMM模型全称为GaussianMixtureModel,即高斯混合模型。其主要是针对普通的单个高斯模型提出来的。我们知道,普通高斯模型对...