使用jieba库与wordcloud库第三方库进行词频统计

时间:2023-03-10 06:55:25
使用jieba库与wordcloud库第三方库进行词频统计

一、jieba库与wordcloud库的使用

1.jieba库与wordcloud库的介绍

  jieba 库的分词原理是利用一个中文词库,将待分词的内容与分词词库进行比对,通过图结构和动态规划方法找到最大概率的词组;除此之外,jieba 库还提供了增加自定义中文单词的功能。

  wordcloud是优秀的词云展示第三方库,以词语为基本单位,通过图形可视化的方式,更加直观和艺术的展示文本。

2.安装jieba库与wordcloud库

  在运行里输入 pip install wordcloud和pip install jieba,等待安装完成。

二、jieba函数介绍

使用jieba库与wordcloud库第三方库进行词频统计

三、调用库函数

from wordcloud import WordCloud
with open("斗破苍穹.txt" ,encoding="utf-8")as file:
#1.读取文本内容
text=file.read()
#2.设置词云的背景颜色、宽高、字数
wordcloud=WordCloud(font_path="C:/Windows/Fonts/simfang.ttf",
background_color="black",width=600,
height=300,max_words=50).generate(text)
#3.生成图片
image=wordcloud.to_image()
#4.显示图片
image.show()