【文件属性】:
文件名称:Archilife-NLP:常见NLP任务的可视化
文件大小:2.43MB
文件格式:ZIP
更新时间:2021-05-27 07:27:25
natural-language-processing text-classification clustering pca topic-modeling
自然语言处理可视化(NLP visualization demo)
目录
前言
目的
为了在佑生基金会报告Text Analytics with Python: A Practical Real-World Approach to Gaining Actionable Insights from your Data ,实作了一遍书中介绍的各种NLP操作,并将结果以视觉化的图表呈现。由于原作者已经提供了完整程式码,这里就只简单记录一些结果。重点在呈现有那些可视化操作,而不是具体的程式码。
补记:这本书2019年出了第二版,内容大致上差不多,主要的区别是:
旧版使用Python 2,新版使用Python 3
新版增加了一个章节讲深度学习
新版提到比较多可视化的工具
主要工具
NLTK
scikit-learn
spaCy
gensim
fastHan
scattertext
bok
【文件预览】:
Archilife-NLP-master
----tfidf_embeddings_across_docs_fromEN.html(740KB)
----Empath_topics_fromEN.html(1.04MB)
----term_characteristic_fromCH_CleanTokens.html(1.3MB)
----NER_characteristic_fromEN_NER_Label.html(398KB)
----NER_scattertext_fromEN_NER_Label.html(386KB)
----NER_scattertext_fromCH_NER_Label.html(394KB)
----DataFrame_by_articles_101rows.pkl(2.78MB)
----NER_characteristic_fromCH_NER_Label.html(402KB)
----term_characteristic_fromEN.html(1.15MB)
----LICENSE(1KB)
----term_scattertext_fromEN.html(1.03MB)
----README.md(16KB)
----DataFrame_by_paragraphs_412rows.pkl(672KB)