【文件属性】:
文件名称:Kurdish-Language:NLP在库尔德语中的应用
文件大小:117.66MB
文件格式:ZIP
更新时间:2021-04-30 04:31:46
nlp speech-recognition kurdish HTML
库尔德语
此仓库将尝试在库尔德语上尝试不同的NLP技术
主要的挑战是关于这种语言只有两个或三个官方数据集。
当前的工作集中在语音识别任务上。
短期计划
文字预处理
音频预处理
为该任务训练一个简单的RNN
长期目标
建立端到端的ASR管道
使用语言模型
管道
获取原始的.sph文件
转换.sph到.wav格式
将.wav转换为pcm-16 wav
将音频和脚本转换为JSON表示形式的
将数据分为训练和验证语料库
【文件预览】:
Kurdish-Language-master
----language-modeling()
--------img()
--------language_grapher.ipynb(6KB)
--------requirements.txt(7B)
--------README.md(307B)
----speech-recognition()
--------train_utils.py(3KB)
--------utils.py(5KB)
--------char_map.py(497B)
--------sample_models.py(7KB)
--------data_engineering.ipynb(5KB)
--------data_generator.py(13KB)
--------README.md(3KB)
--------utils()
--------kurdish_dnn_speech_recognizer_training.ipynb(296KB)
----index.html(1.61MB)
----.gitignore(36B)
----embedding()
--------tensorboard-data()
----README.md(787B)
----visualizations()
--------tsne.gif(6.93MB)
--------query.gif(5.13MB)
--------start.gif(1.41MB)
----utils()
--------text8.txt(26.7MB)
--------dump_to_words_processor.ipynb(41KB)
--------text8ku.txt(16.88MB)
----favicon.ico(1KB)