yahoo answer scv dataset

时间:2020-11-12 08:12:42
【文件属性】:
文件名称:yahoo answer scv dataset
文件大小:304.68MB
文件格式:GZ
更新时间:2020-11-12 08:12:42
nlp 模型结构很简单,文本输入x,先进行embedding,然后将整句话的每个单词向量计算平均值,最后接fc+softmot进行分类。官方论文中的关键点: 1)不使用预训练word2vec,直接利用标签样本进行学习词嵌入矩阵,也许是因为我们最终要通过对词向量做平均得到句向量,所以不追求单个词向量性能? 2)fc隐层输出可作为句向量,供其他任务使用;
【文件预览】:
yahoo_answers_csv
----classes.txt(183B)
----test.csv(30.56MB)
----train.csv(711.41MB)
----readme.txt(2KB)

网友评论