tmw:三千万字倡议的项目工作

时间:2021-06-03 16:53:05
【文件属性】:
文件名称:tmw:三千万字倡议的项目工作
文件大小:16KB
文件格式:ZIP
更新时间:2021-06-03 16:53:05
Python RCC 将在这里分享与项目相关的工作。 TMW 倡议正在寻求立即帮助,以构建基于其纵向研究中各种参与者新转录的语音样本(母亲/儿童互动)的语音数据库。 除了转换和验证提供的成绩单(作为生成话语数据集的初步步骤)之外,他们还要求对话语数据集进行基本的语音分析(即,他们希望每个说话者(父母和child) 在每个可用的时间点: MLU(平均话语长度) 包含至少一个字母的话语字段的计数 单词标记计数(单词标记的数量,使用默认标记化) 词类型计数(唯一词标记的数量,非词法化) 该分析将利用和。
【文件预览】:
tmw-master
----.gitignore(19B)
----README.md(1KB)
----requests()
--------.gitignore(44B)
--------README.md(35B)
--------2014-05-22()
--------2015-04-23()
--------2015-04-28()
--------2015-03-03()

网友评论