german2vec:使用深度学习的德语语言模型和文本分类

时间:2021-05-13 04:18:39
【文件属性】:
文件名称:german2vec:使用深度学习的德语语言模型和文本分类
文件大小:1.04MB
文件格式:ZIP
更新时间:2021-05-13 04:18:39
nlp deep-learning fastai JupyterNotebook 德语2vec 概述 该存储库包含用于使用库构建德语模型并将其应用于各种NLP任务(例如文本分类)的文档和代码。 语言模型基于由首次发布的3层 。 该模型的骨干在德语*语料库上进行了训练,并使用转移学习将其应用于文本分类任务(如“所述)。 更新: 可从以下网站获得使用德语*语料库的预训练语言模型: : 。 感谢您的分享,托马斯! 项目结构 data/ -德语语言模型(可从) doc/ -文档和实施说明 sb-10k_german_sentiment_classification/ 原始数据 scr/ -用于NLP分类的各种实验的笔记本 笔记本 任务 sb-10k-use_pretrained_language_model.ipynb 分类器(基于预先训练的语言模型构建) sb-10k_small_wikipedia_corpus.ipynb 分类器(使用德语维基
【文件预览】:
german2vec-master
----.gitignore(1KB)
----README.md(2KB)
----prepare_wikipedia.sh(468B)
----sb-10k_german_sentiment_classification()
--------prepare_twitter_data.sh(195B)
--------corpus_v1.0.tsv(671KB)
----.gitattributes(66B)
----src()
--------sb-10k-data_preprocessing.ipynb(25KB)
--------sb-10k-use_pretrained_language_model-fixed_LR.ipynb(193KB)
--------sb-10k_small_wikipedia_corpus.ipynb(191KB)
--------sb-10k-use_pretrained_language_model.ipynb(190KB)
----doc()
--------notes.txt(152B)
--------xstartup(269B)
--------install_vnc.txt(221B)
----data()
--------DE_spacy_itos.pkl(1.09MB)

网友评论