【文件属性】:
文件名称:open_stt:打开STT
文件大小:14KB
文件格式:ZIP
更新时间:2021-05-22 22:24:16
dataset russian automatic-speech-recognition speech-to-text stt
俄语开放语音转文本(STT / ASR)数据集
可以说是迄今为止最大的俄罗斯公共STT数据集:
约16m的发音(1-2m的注释不够完美,请参见 );
约20000小时;
2,3 TB( int16中为.wav格式),. opus中为.opus ;
新领域-公开演讲;
庞大的Radio数据集可更新10 000多个小时;
(新! )与OPUS合作的实用程序;
(新! )新的OPUS洪流;
(新! )新的OPUS直接链接;
证明错了! 公开问题,合作,提交公关,贡献,共享您的数据集! 让我们以俄语(及更多)使STT开放并作为CV模型提供。
重要的-假设ё到处被替换е 。
计划发布:
正在使用其他3种语言进行新项目,敬请期待!
目录
下载说明
端到端下载脚本
注释方法
音频标准化
磁盘数据库方法
辅助功能
如何打开作品
联络人
致谢
常问问题
执照
捐献
商业查询
进一步阅
【文件预览】:
open_stt-master
----md5sum.lst(3KB)
----LICENSE(73B)
----download.py(724B)
----.github()
--------FUNDING.yml(671B)
----utils()
--------soundfile_opus.py(1KB)
--------open_stt_utils.py(6KB)
----README.md(29KB)
----download.sh(639B)