【文件属性】:
文件名称:PyTorch_Speaker_Verification
文件大小:276.23MB
文件格式:ZIP
更新时间:2021-02-18 16:33:47
C
PyTorch_Speaker_Verification
语音嵌入网络和损失的PyTorch实施在此处描述: ://arxiv.org/pdf/1710.10467.pdf。
还包含用于创建嵌入的代码,这些嵌入可作为在找到的说话人差异化模型的输入兼容
TIMIT语音语料库用于训练模型,可在以下位置找到: : 或此处,
依存关系
PyTorch 0.4.1
python 3.5+
numpy的1.15.4
librosa 0.6.1
在上找到的python WebRTC VAD是创建运行dvector_create.py所必需的,而不是训练神经网络。
预处理
将以下config.yaml密钥更改为包含下载的TIMIT数据集中的所有.WAV文件的正则表达式。 对于dvector_create.py脚本,必须将TIMIT .WAV文件转换为标准格式(RIFF),但对于训练神经