setk:与Kaldi集成的语音增强工具

时间:2024-06-03 06:29:45
【文件属性】:

文件名称:setk:与Kaldi集成的语音增强工具

文件大小:31.97MB

文件格式:ZIP

更新时间:2024-06-03 06:29:45

speech kaldi beamforming speech-separation speech-enhancement

SETK:与Kaldi集成的语音增强工具 这是与集成的一些语音增强/分离工具。 我将它们用于前端的数据处理。 Python脚本 受监督的(基于掩模的)自适应波束形成器(GEVD / MVDR / MCWF ...) MATLAB,Numpy和Kaldi之间的数据转换 数据可视化(TF遮罩,空间/光谱特征,光束方向图...) Kaldi脚本,档案,wave和numpy的ndarray的统一数据和IO处理程序... 无监督掩码估计(CGMM / CACGMM) 空间/光谱特征计算 DS(延迟和总和)波束形成器,SD(上方向)波束形成器 AuxIVA,WPE和WPD,FB(固定波束形成器) 遮罩计算(iam,irm,ibm,psm,crm) RIR仿真(1D / 2D阵列) 单通道语音分离(TF频谱屏蔽) Si-SDR / SDR / WER评估 pywebrtc vad包装器


网友评论