End-to-end-ASR

时间:2021-03-20 07:19:39
【文件属性】:
文件名称:End-to-end-ASR
文件大小:858KB
文件格式:ZIP
更新时间:2021-03-20 07:19:39
Python 端到端自动语音识别系统-PyTorch实现 这是和我的端到端ASR的开源项目(以前名为Listen,Attend和Spell-PyTorch实现)。实施大部分是通过著名的深度学习工具包Pytorch完成的。 端到端的ASR基于“聆听”,“参加”和“法术 。还实现了最近提出的多种技术,这些技术可作为其他插件以获得更好的性能。有关实施的技术的列表,请参考,和。 随时使用/修改它们,任何错误报告或改进建议将不胜感激。如果您发现此项目对您的研究有所帮助,请务必考虑引用,谢谢! 强调 特征提取 使用torchaudio作为后端的动态特征提取 字符/子词 /文本的词编码 培训端到端ASR 具有不同类型的编码器/注意Seq2seq ASR 基于CTC的ASR ,也可以与前者混合使用 yaml样式的模型构建和超参数设置 使用培训过程可视化,包括注意对齐 具有端到端ASR的语音识别(即解码) 波束搜索解
【文件预览】:
End-to-end-ASR-master
----eval.py(3KB)
----bin()
--------train_lm.py(5KB)
--------test_asr.py(11KB)
--------train_asr.py(10KB)
--------__init__.py(1B)
----config()
--------libri()
--------README.md(10KB)
----main.py(3KB)
----tests()
--------sample_data()
--------test_audio.py(3KB)
--------test_text.py(3KB)
----LICENSE(1KB)
----src()
--------option.py(449B)
--------optim.py(3KB)
--------audio.py(4KB)
--------text.py(7KB)
--------asr.py(15KB)
--------module.py(9KB)
--------lm.py(2KB)
--------util.py(5KB)
--------attention.py(4KB)
--------ctc.py(14KB)
--------__init__.py(0B)
--------solver.py(8KB)
--------bert_embedding.py(3KB)
--------decode.py(11KB)
--------data.py(9KB)
--------plugin.py(7KB)
----.idea()
--------End-to-end-ASR-Pytorch-master.iml(691B)
--------misc.xml(394B)
--------vcs.xml(180B)
--------deployment.xml(955B)
--------remote-mappings.xml(555B)
--------modules.xml(310B)
--------.gitignore(176B)
--------inspectionProfiles()
----requirements.txt(93B)
----corpus()
--------librispeech.py(4KB)
----.gitignore(1KB)
----README.md(10KB)
----util()
--------generate_vocab_file.py(3KB)

网友评论