UrbanSound8K---Audio-Classification:使用CNN根据使用LIBROSA提取的特征对音频样本进行分类

时间:2024-04-22 13:32:42
【文件属性】:
文件名称:UrbanSound8K---Audio-Classification:使用CNN根据使用LIBROSA提取的特征对音频样本进行分类
文件大小:387KB
文件格式:ZIP
更新时间:2024-04-22 13:32:42
JupyterNotebook 介绍 该数据集包含来自10个类别的城市声音的8732个标记的声音摘录(<= 4s):空调,汽车喇叭,儿童玩耍,狗吠,钻探,enginge_idling,gun_shot,手提钻,警笛和street_music。 这些类别是根据城市声音分类法得出的。 有关数据集及其编译方式的详细说明,请参阅我们的论文。 所有摘录均取自上传到现场录音。 这些文件已预先排序为十折(名为fold1-fold10的文件夹),以帮助复制和比较上面文章中报告的自动分类结果。 除声音摘录外,还提供了一个CSV文件,其中包含有关每个摘录的元数据。 数据集链接-https: 方法 1.有3种基本方法可以从音频文件中提取特征:a)使用音频文件的mffcs数据b)使用音频的频谱图图像,然后将其转换为数据点(就像对图像所做的那样)。 使用Librosa的mel_spectogram函数可以轻松完成此操作。c)结合两个功能以构建
【文件预览】:
UrbanSound8K---Audio-Classification-main
----urbansound8k-audio-classification.ipynb(712KB)
----README.md(1KB)

网友评论