Python stylecloud制作酷炫的词云图

时间:2023-02-11 12:12:56

 ✅作者简介:热爱科研的算法开发者,Python、Matlab项目可交流、沟通、学习。

 ????个人主页:算法工程师的学习日志

这周参加一个创新培训,结束后有个答辩需要制作ppt,为了更好的展示内容,想到用词云图。本文分享一下如何基于Python的stylecloud制作酷炫的词云图。stylecloud是wordcloud优化改良版,操作简单,直接调用。


  • 可以使用 Font Awesome 提供的免费图标更改词云的形状;
  • 通过 palettable 更改调色板以自定义风格,更改背景颜色;
  • 添加梯度使颜色按照特定方向流动。

1、基本说明

首先安装stylecloudjieba库,jieba主要用来做语义分割用,因为使用的时候会遇到文本解析

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple stylecloud
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba

gen_stylecloud 的默认参数

def gen_stylecloud(text=None,
file_path=None, # 输入文本/CSV 的文件路径
size=512, # stylecloud 的大小(长度和宽度)
icon_name='fas fa-flag', # stylecloud 形状的图标名称(如 fas fa-grin)。[default: fas fa-flag]
palette='cartocolors.qualitative.Bold_5', # 调色板(通过 palettable 实现)。[default: cartocolors.qualitative.Bold_6]
colors=None,
background_color="white", # 背景颜色
max_font_size=200, # stylecloud 中的最大字号
max_words=2000, # stylecloud 可包含的最大单词数
stopwords=True, # 布尔值,用于筛除常见禁用词
custom_stopwords=STOPWORDS,
icon_dir='.temp',
output_name='stylecloud.png', # stylecloud 的输出文本名
gradient=None, # 梯度方向
font_path=os.path.join(STATIC_PATH,
'Staatliches-Regular.ttf'), # stylecloud 所用字体
random_state=None, # 控制单词和颜色的随机状态
collocations=True,
invert_mask=False,
pro_icon_path=None,
pro_css_path=None):

在 word.txt 中有下面的一段话

Python面向对象---类的基本使用
面向对象
类(class):是一种用来描述具有相同属性和方法的对象的集合。
类变量:类变量在整个实例化的对象中是公用的。一般定义在类中且在函数体之外。
方法:类中的函数
数据成员:类变量或者实例变量用于处理类及其实例对象的相关的数据。
方法重写:如果从父类继承的方法不能满足子类的需求,可以对其进行改写,这个过程叫方法的覆盖(override),也称为方法的重写。
局部变量:定义在方法中的变量,只作用于当前实例的类。
实例变量:在类的声明中,属性是用变量来表示的,这种变量就称为实例变量,实例变量就是一个用 self 修饰的变量。
继承:即一个派生类(derived class)继承基类(base class)的字段和方法。继承也允许把一个派生类的对象作为一个基类对象对待。就像我们定义一个fruit(水果)类,然后又定义了一个fruit类的派生类apple(苹果),它有着fruit类的一些属性和方法,也有着自己的一些独特的属性和方法,和fruit类是一种’is-a’的关系。
实例化:类的一个具体对象,类像当于一个模板,只有我们将其实例化为一个对象后才能对其进行相应的操作。
对象:通过类定义的数据结构实例。对象包括两个数据成员(类变量和实例变量)和方法。

默认情况下,词云的形状是一面旗帜

# -*- coding: utf-8 -*-


import jieba
from stylecloud import gen_stylecloud




def cloud(file_name):
with open(file_name, 'r', encoding='utf8') as f:
word_list = jieba.cut(f.read())
result = " ".join(word_list) # 分词用 隔开
# 制作中文云词
gen_stylecloud(text=result,
font_path='C:\\Windows\\Fonts\\simhei.ttf',
output_name='t1.png',
) # 必须加中文字体,否则格式错误




if __name__ == "__main__":
file_name = './word.txt'
cloud(file_name)


Python stylecloud制作酷炫的词云图


2、用法

2.1、设置背景

# -*- coding: utf-8 -*-


import jieba
from stylecloud import gen_stylecloud




def cloud(file_name):
with open(file_name, 'r', encoding='utf8') as f:
word_list = jieba.cut(f.read())
result = " ".join(word_list) # 分词用 隔开
# 制作中文云词
gen_stylecloud(text=result,
font_path='C:\\Windows\\Fonts\\simhei.ttf',
background_color='black',
output_name='t2.png',
) # 必须加中文字体,否则格式错误




if __name__ == "__main__":
file_name = './word.txt'
cloud(file_name)



Python stylecloud制作酷炫的词云图


2.2、更改调色板以自定义风格

# -*- coding: utf-8 -*-


import jieba
from stylecloud import gen_stylecloud




def cloud(file_name):
with open(file_name, 'r', encoding='utf8') as f:
word_list = jieba.cut(f.read())
result = " ".join(word_list) # 分词用 隔开
# 制作中文云词
gen_stylecloud(text=result,
font_path='C:\\Windows\\Fonts\\simhei.ttf',
palette='colorbrewer.diverging.Spectral_11',
output_name='t3.png',
) # 必须加中文字体,否则格式错误




if __name__ == "__main__":
file_name = './word.txt'
cloud(file_name)

Python stylecloud制作酷炫的词云图

更多的配色参考 ​https://jiffyclub.github.io/palettable/​

Python stylecloud制作酷炫的词云图

Python stylecloud制作酷炫的词云图

Python stylecloud制作酷炫的词云图

使用 Font Awesome 提供的免费图标更改词云的形状(不用自己找形状)

​https://fontawesome.dashgame.com/​

Python stylecloud制作酷炫的词云图

选择某个图标,右击复制,把这个图标内容粘贴到代码即可

Python stylecloud制作酷炫的词云图


# -*- coding: utf-8 -*-


import jieba
from stylecloud import gen_stylecloud




def cloud(file_name):
with open(file_name, 'r', encoding='utf8') as f:
word_list = jieba.cut(f.read())
result = " ".join(word_list) # 分词用 隔开
# 制作中文云词
gen_stylecloud(text=result,
font_path='C:\\Windows\\Fonts\\simhei.ttf',
palette='cartocolors.diverging.Fall_4',
icon_name='fas fa-car',
output_name='t4.png',
) # 必须加中文字体,否则格式错误




if __name__ == "__main__":
file_name = './word.txt'
cloud(file_name)


Python stylecloud制作酷炫的词云图


2.3、设置颜色梯度方向

垂直方向

import jieba
from stylecloud import gen_stylecloud




def cloud(file_name):
with open(file_name, 'r', encoding='utf8') as f:
word_list = jieba.cut(f.read())
result = " ".join(word_list) # 分词用 隔开
# 制作中文云词
gen_stylecloud(text=result,
font_path='C:\\Windows\\Fonts\\simhei.ttf',
palette='cartocolors.diverging.TealRose_2',
icon_name='fas fa-bell',
gradient='vertical',
output_name='t5.png',
) # 必须加中文字体,否则格式错误




if __name__ == "__main__":
file_name = './word.txt'
cloud(file_name)

Python stylecloud制作酷炫的词云图

水平方向

import jieba
from stylecloud import gen_stylecloud




def cloud(file_name):
with open(file_name, 'r', encoding='utf8') as f:
word_list = jieba.cut(f.read())
result = " ".join(word_list) # 分词用 隔开
# 制作中文云词
gen_stylecloud(text=result,
font_path='C:\\Windows\\Fonts\\simhei.ttf',
palette='cartocolors.diverging.TealRose_2',
icon_name='fas fa-bell',
gradient='horizontal',
output_name='t6.png',
) # 必须加中文字体,否则格式错误




if __name__ == "__main__":
file_name = './word.txt'
cloud(file_name)

Python stylecloud制作酷炫的词云图

3、关键字模式

如果是提供关键字来生成词云,例如word1.txt

Python
ython
thon
hon
on
n
Matlab
atlab
tlab
lab
ab
b
数学分析
学分析
分析

大数据
数据

算法

人工智能
工智能
智能

创新

创业

科技

我也不知道
也不知道
不知道
知道

代码如下

import jieba
from stylecloud import gen_stylecloud




def cloud(file_name):
with open(file_name, 'r', encoding='utf8') as f:
lines = f.readlines()
result = ''
for line in lines:
result += ' ' + line
# 制作中文云词
gen_stylecloud(text=result,
font_path='C:\\Windows\\Fonts\\simhei.ttf',
output_name='t10.png',
) # 必须加中文字体,否则格式错误




if __name__ == "__main__":
file_name = './word1.txt'
cloud(file_name)

Python stylecloud制作酷炫的词云图


其他的个性化需求设计各位读者可以试一下,

最后分享一个网址,可以直接得到词云,

​http://www.wordart.cc/​