词云图是什么?
词云图又称文字云,是信息可视化的表现形式之一。词云是把文本中出现频率较高的关键词进行视觉上的突出显示,形成关键词云层或关键词渲染,从而过滤掉大量的文本信息。读者可以快速领略文本的主旨。
相对柱状图、折线图、饼图等用来显示数据的图表,词云图可以展示大量文本数据。每个词的重要性(出现的频率)以字号大小表示:字号越大,该关键词越重要。如果想快速了解一段文本的重点,就可以构建一张词云图,从高频词汇去粗略了解。词云图以不同文字的杂乱组合,形成一定形状的图片,不仅能够以很直观的方式展示出重点内容,而且形式炫酷,颜色多变,给人眼前一亮的感觉。
2.怎么使用python制作词云图?
制作词云图很简单,首先需要导入3个库:
import jieba
import wordcloud
import imageio
其中,jieba和wordcloud为第三方库,需要自行安装。而imageio为python自带的库,不需要自行安装。
然后导入一个背景模板,以及需要制作词云图的底图。注意:模板的背景一定要是白色的,不可以是其他颜色或者透明
bg=imageio.v2.imread('D:\kgr1.jpg')
with open('D:/111.txt',encoding='utf-8') as f:
t=f.read()
提取关键字
ls=jieba.lcut(t)
txt=" ".join(ls)
生成词云
w=wordcloud.WordCloud(width=1000,height=700,#词云比例
font_path="msyh.ttc",colormap='pink',#字体&颜色
background_color='white',mask=bg)#背景色&模板
w.generate(txt)
w.to_file(r'D:\pic.png')
效果图如下:
背景模板图片:
生成的词云图:
引用的文字为melt歌词,由此可见ryo写melt的高频词为:"了".如果用这首歌鬼畜,那么在te的发音出现时加速会有很好的鬼畜效果。
wordcloud还有其他功能,可以根据以下内容适度选择喜欢的功能添加:
wordcloud = WordCloud(font_path='simhei.ttf', # 字体
prefer_horizontal= ,#大部分都是横向排放
background_color=' ', # 背景色
max_words= , # 显示单词数
max_font_size= , #最大字号
stopwords= , # 过滤噪声词
mask= ,#背景轮廓
colormap= ,#使用自定义颜色
collocations=False
).generate(txt)
image = wordcloud.to_image()
image.show() # 展示图片
wordcloud.to_file(' ') # 保存图片
3.遇到的坑
做词云图会遇到第三方库安装失败的情况。
试了很多的方法,最后发现以下的方法是可行的:
wordcloud:
安装wordcloud库可以到以下链接下载对应自己的python版本、系统版本的.whl文件:
https://www.lfd.uci.edu/~gohlke/pythonlibs/
这是按首字母排序的。比如我下的是wordcloud‑1.8.1‑cp38‑cp38‑win32.whl,其中cp38就是指我的python版本号是3.8,如果是3.8.1等等也视为3.8;win32就是系统是32位的。如果你的python也没有numpy等等的话也需要安装,如果没有这些那么wordcloud也可能运行不了。
下好了以后,打开cmd,输入pip install 文件所在路径,比如pip install D:\wordcloud‑1.8.1‑cp38‑cp38‑win32.whl,等待提示安装完成即可。如果在pycharm中还是不能运行,可以试试在pycharm中点文件→设置→项目→python解释器→+号搜索,或者直接把第三方库的文件添加到项目/venv/Lib/sitepackages直到不报错为止。
jieba:
同理,但可以试试到这个链接下下载:文章来源:https://www.toymoban.com/news/detail-467194.html
https://pypi.tuna.tsinghua.edu.cn/simple/jieba/文章来源地址https://www.toymoban.com/news/detail-467194.html
到了这里,关于python怎么生成词云图的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!