python-wordcloud词云

10月前作者：蔷莫分类：Toy博客阅读(38) 违法举报

这篇具有很好参考价值的文章主要介绍了python-wordcloud词云。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

导入模块

from wordcloud import WordCloud
import jieba
import imageio
import matplotlib.pyplot as plt
from PIL import ImageGrab
import numpy as np

wordcloud以空格为分隔符号，来将文本分隔成单词

PIL pillow模块

img = imageio.imread('image.png')

这行代码使用imageio库读取一个名为“image.png”的图像文件，并将图像作为numpy数组存储在变量“img”中

python-wordcloud词云,python,jupyter,wordcloud
dir可以查看一些东西

WordCloud对象创建的常用参数

font_path：字体文件的路径 - - - 默认None
width，height：词云生成图片的宽高 - - - 默认宽400px，高200px
mask：词云形状 - - -默认None（方形图）
min_font_size，max_font_size：词云中最大最小的字体字号 - - - 最小4号最大根据高度自动调节
font_step：字号步进间隔 - - - 默认1
max_words：最大次数 - - - 200
stopwords：被排除的词列表，排除词不在词云中显示 - - - stopwords={‘python’}
background_color：图片背景色 - - - 黑色
repeat=True：词太少时可以让词重复出现在词云中
contour_width，contour_color：添加词云边框和边框颜色
colormap：修改字体颜色
Matplotlib附带的色彩映射参考

WordCloud类的常用方法

generate(text)：由text文本生成词云
to_file(filename)：将词云图保存为名为filename的文件
to_image() ：可以直接在jupyter里面看到词云的图片

案例

from wordcloud import WordCloud

w = WordCloud()
w.generate('hi hi hello hi hi hello world!')
w.to_file('hi.png')

python-wordcloud词云,python,jupyter,wordcloud

import wordcloud

w = wordcloud.WordCloud(background_color='white',repeat=True)
text = 'hi,hello world!'

w.generate(text) 
w.to_image()

python-wordcloud词云,python,jupyter,wordcloud

w = wordcloud.WordCloud(background_color='white',repeat=True,colormap='PuRd_r')

python-wordcloud词云,python,jupyter,wordcloud

mask = np.array(PIL.Image.open('aixin.png'))
w = wordcloud.WordCloud(mask=mask,background_color='white',repeat=True,colormap='PuRd_r')

默认mask表示为binary(二进制)
对应参数是numpy 中的 array数组，将图片用PIL库打开使用矩阵表示出来（图像本质就是矩阵）
python-wordcloud词云,python,jupyter,wordcloud

mask = np.array(PIL.Image.open('aixin.png'))
w = wordcloud.WordCloud(mask=mask,background_color='white',repeat=True,colormap='RdBu',contour_color='black',contour_width=5)

python-wordcloud词云,python,jupyter,wordcloud

w = wordcloud.WordCloud(mode='RGBA',mask=mask,background_color='white',repeat=True,colormap='RdBu')

mode=‘RGBA’ 保存的图片不能为.jpg后缀，可以使用png

from wordcloud import WordCloud
import imageio
import matplotlib.pyplot as plt

mk = imageio.imread('aixin.png')  # 打开图片文件
w = WordCloud(mask=mk,background_color='lightpink',font_path='msyh.ttc',colormap='Accent',min_font_size=2,stopwords={'就在这时'}) # msyh微软雅黑字体
f = open('data.txt','r',encoding='utf-8')
w.generate(f.read())
plt.imshow(w)   # 显示词云
plt.axis('off') # 隐藏坐标轴
plt.show()
w.to_file('aixincy.png') # 保存的词云图片大小和mask图片的大小一样

python-wordcloud词云,python,jupyter,wordcloud

w.generate(" ".join(jieba.lcut(txt)))即为用空格的方法去分隔jieba库精确模式下形成的字符串。

jieba自带的词库包括：

dict.txt.big - 大型词库，包含约2.7万个词汇和常用词语
dict.txt.small - 小型词库，包含约1.4万个词汇和常用词语
user.dict - 用户自定义词库，用户可以将自己的词汇添加到此文件中
stop_words.txt - 停用词词典，包含约1000个常用停用词
idf.txt - 关键词权重词典，用于提取文本中的关键词
stop_words_cn.txt - 中文停用词词典，包含约1500个常用停用词
stopwords.txt - 英文停用词词典，包含约400个常用停用词jieba自带的词库包括：文章来源地址https://www.toymoban.com/news/detail-701963.html

到了这里，关于python-wordcloud词云的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

让你的作品更出色——词云Word Cloud的制作方法（基于python，WordCloud，stylecloud)

词云Word Cloud的制作方法（基于python) 本文目录：一、词云的简介二、实现原理和流程 1、制作词云流程图 2、词云实现原理三、实现词云的方式 1、安装词云相关模块库 2、WordCloud库 3、stylecloud库四、总结词云，又称文字云，英文名：Word Cloud。是文本数据的视觉表示形式。

2023年04月09日
浏览(49)
echarts-wordcloud词云

echarts-wordcloud是基于echarts的一个插件，所以我们要首先安装echarts包，然后再安装echarts-wordcloud的包，这里我的练习项目安装的版本；当然，你可以随意安装你需要的版本； “echarts”: “^5.3.3”, “echarts-wordcloud”: “^2.0.0”, npm install echarts@5.3.3 npm install echarts-wordcloud@2.0.0 基本

2024年01月22日
浏览(41)
Wordcloud | 风中有朵雨做的‘词云‘哦！~

今天可算把 key 搞好了，不得不说🏥里手握生杀大权的人，都在自己的能力范围内尽可能的难为你。😂 我等小大夫也是很无奈，毕竟奔波霸、霸波奔是要去抓唐僧的。 🤐 好吧，今天是词云（ Wordcloud ）教程，大家都说简单，但实际操作起来又有一些难度，一起试试吧

2024年02月12日
浏览(35)
【python 的各种模块】(8) 在python使用matplotlib和wordcloud库来画wordcloud词云图

目录目标：用python画出，网上流行的wordcloud词云图 1 准备工作 1.1环境准备 1.1.1安装步骤 1.2 资源准备 1.2.1 文本文件内容如下 1.2.2 图片资源 2 代码测试 2.1 第一版代码和效果 2.1.1 代码和效果 2.1.2 一般plt里解决中文乱码问题 2.1.3 wordcloud的中文显示方框解决办法 2.2 修改后的代

2024年02月03日
浏览(74)
python安装wordcloud包报错：No module named ‘wordcloud‘

直接在cmd使用pip install wordcloud进行安装后，在jupyter notebook中导入wordcloud包会报错发现是因为没有安装在anaconda的路径里解决方法：打开anaconda prompt进行pip install wordcloud，安装完成后可以在jupyter环境中成功导入去年这时候安过一次wordcloud包，当时好像也有这个问题，没有及时

2024年02月11日
浏览(49)
Python数据可视化——Python创建词云创建心形词云（MacWindows都可以运行）

作者：大锤爱编程的博客_CSDN博客-大数据,Go,数据分析领域博主关注我能学习到大数据、Python数据分析，以及各种自我提升小技巧摘要：在本博客中，我们将介绍如何使用Python创建形状词云。我们将使用WordCloud库、NumPy、PIL和Matplotlib创建一个简单而有趣的心形词云。通过本文

2023年04月23日
浏览(41)
【Python | 词云】聊天记录绘制超美词云（七夕快乐，曾同学）

解释器： python.3.9 编译器： jupyter notebook 时间： 8/4 10:20 本次聊天记录是收集于我和曾同学 QQ 一年以来的聊天记录,一起看看你们情侣间说过最多的是哪句话吧！代码每条信息共同点都是：使用 re 模块去除不需要的 [图片] , 用户名和换行符 n ，以及日期和高频率的系统消

2024年02月10日
浏览(37)
python--wordcloud库的使用

目录 1.wordcloud库简介 2.wordcloud的基本使用 3.wordcloud使用实例（在图形中生成词云） 1.词云库简介 wordcloud库是python中的一个第三方库，wordcloud直译过来是“词云” 词云：以词语为基本单位，更加直观和艺术的展示文本。另外词云库需要先自行安装安装方法：命令行安装：c

2024年02月09日
浏览(48)
由简如易的Python词云

这是我的第一篇文章，因为周围好多同学都在发，今天俺也漏这第一手。开始啦。小伙伴，首先你要确保自己的python已经安装好wordcloud库。建议用这样的方式 pip install numpy matplotlib pillow wordcloud imageio jieba snownlp itchat -i https://pypi.douban.com/simple wordcloud 库为每一个词云生成一个

2024年02月08日
浏览(44)
【Python篇】python库讲解（wordcloud | jieba）

jieba库是一个流行的中文分词工具，它基于统计算法和词频字典，能够将连续的汉字序列切割成有意义的词语。下面是对jieba库的简要理论说明：分词原理：jieba库使用了基于前缀词典的最大匹配算法来进行中文分词。该算法从文本的开头开始，根据词典中的词语长度依次匹配

2024年02月04日
浏览(38)