matlab提取文件要素代码-CoviDSP:CoviDSP

时间:2024-06-10 10:08:05
【文件属性】:

文件名称:matlab提取文件要素代码-CoviDSP:CoviDSP

文件大小:27KB

文件格式:ZIP

更新时间:2024-06-10 10:08:05

系统开源

matlab提取文件要素代码 CoviDSP :speaker_high_volume: :studio_microphone: 最终项目:说话人识别系统 详细说明: Howard Kao-hkao [at] ucdavis [dot] edu William Orozco-worozco [在] ucdavis [点] edu EEC201-加州大学戴维斯分校。 2021年冬季季度 A.引言 该项目的目的是建立一个自动的说话人识别系统。 通过对信号应用傅立叶变换,从输入语音中提取特征,然后获得梅尔频率倒谱系数(MFCC)。 音频信号的特性会随时间变化。 因此,应用加窗和短时傅立叶变换可以方便地找到具有有用信息的区域,并隔离无用的扇区。 剩下的信号是用于训练和评估每个测试扬声器的功能。 特征提取后,我们准备使用LBG算法计算质心。 它们是每个发言者的代码簿的代码字。 最后,我们通过识别不同数据集中的说话者来测试系统。 待办事项:添加流程图 B.数据预处理 输入信号包含11个不同的人,说“零”一词。 每个采样率均为12.5 KHz。 在特征提取过程之前,对信号进行分析以获得诸如形状,幅度,均值,噪声和安静区域的一般特征。 在下图中,我们比较了扬声器3的原始信号


【文件预览】:
CoviDSP-main
----LICENSE(34KB)
----lbg.m(3KB)
----README.md(17KB)
----melfb.m(1KB)
----normAudio.m(313B)
----CoviDSP1.m(17KB)
----disteu.m(771B)
----mfcc_own.m(1KB)
----CoviDSP1_notch.m(5KB)

网友评论