wordcloud制作词云图

这篇具有很好参考价值的文章主要介绍了wordcloud制作词云图。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


wordcloud

WordCloud(font_path=None, width=400, height-200,margin=2,mask=None, max_words=200, min_font_size=4, stopwords=None,background_color='black', max_font_size=None, font_step=1)
  • font_path:字体路径,默认不支持中文,可通过该参数指定字体,支持OTF和TTF 格式;
  • width、 height:画布的宽度和高度,单位为像素
  • margin:文字之间的边距
  • mask:指定图片的形状,忽略白色部分,通常为 ndarray
  • max_words:最多显示的词的数量,默认为200
  • min_font_size、max_font_size:最小字体大小、最大字体大小
  • font_step:字体大小增加步长,默认为1
  • background_color:词云图的背景颜色,默认为黑色
  • generate (text):根据文本生成词云图,返回当前对象本身;
  • to_image():将词云对象转化为图片
  • to_file(文件名):将词云对象转化为文件
  • to_array():将词云对象转化为数组
import wordcloud as wc
import random
word_cloud = wc.WordCloud()
res = random.choices(["Python","Hello","中国","人民","World","program","first","PHP"], k=100)
text = " ".join(res)
print(text)
word_cloud.generate(text)
word_cloud.to_file("abab.png")

中文方框问题

当字符串中有中文时,生成的词云图会变成方框。
wordcloud制作词云图

这是因为不支持中文,我们需要添加字体文件。我们可以去c盘中(C:\Users\Administrator\AppData\Local\Microsoft\Windows\Fonts)复制一个字体文件放在python目录(D:\code\python\python37\libs)中。

wordcloud制作词云图
然后在代码中指定font路径。

word_cloud = WordCloud(font_path=r'D:\code\python\python37\libs\simfang.ttf')

显示图片

import matplotlib.pyplot as plt
# 显示词云图
plt.imshow(word_cloud)
plt.show()

jieba(分词)

jieba库分词的三种模式

(1) 精准模式:把文本精准地分开,不存在冗余
(2) 全模式:把文中所有可能的词语都扫描出来,存在元余(2)
(3) 搜索引擎模式:在精准模式的基础上,再次对长词进行切分文章来源地址https://www.toymoban.com/news/detail-434646.html

  • jieba.cut(sentence, cut_all=False, HMM=True) :sentence表示需要分词的句子,cut_all表示是否采用全模式,HMM 表示是否使用 HMM ( 隐马尔可夫模型 )模型
  • jieba.cut_for_search(sentence, HMM=True) :sentence表示需要分词的句子,HMM表示是否使用 HMM模型,该方法适合用于搜索引擎构建倒排索引的分词,粒度比较细;
  • jieba.cut()方法和 jieba.cut_for_search() 方法返回的结果都是可迭代对象,可使用 for 循环获取分词后得到的每一个词语,此外,jieba.lcut()jieba.lcut_for_search()效果分别和jieba.cut()jieba.cut_for_search()效果类似,直接返回列表
  • add_word(word, freq=None, tag=None)del_word(word) 可在程序中动态修改词典
import jieba
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
from wordcloud import WordCloud

# 读取图片
mask = np.array(Image.open("ciyun1.png"))
# 创建词云
words = WordCloud(font_path="msyh.ttc",mask=mask,background_color="black",width=1000,height=700,min_font_size=6)
with open("text.txt","r+",encoding="utf-8") as fp:
    text = fp.read() # 读取文件内容
text = " ".join(jieba.lcut(text))#通过空格连接分好的词
words.generate(text) # 生成词云
words.to_file('abc.png') # 保存词云图
plt.imshow(words) # 显示图片
plt.axis("off")#不显示坐标轴
plt.show()# #显示图

到了这里,关于wordcloud制作词云图的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 让你的作品更出色——词云Word Cloud的制作方法(基于python,WordCloud,stylecloud)

    词云Word Cloud的制作方法(基于python) 本文目录: 一、词云的简介 二、 实现原理和流程 1、制作词云流程图 2、词云实现原理 三、 实现词云的方式 1、安装词云相关模块库 2、WordCloud库 3、stylecloud库 四、总结 词云,又称文字云,英文名:Word Cloud。是文本数据的视觉表示形式。

    2023年04月09日
    浏览(45)
  • python安装wordcloud包报错:No module named ‘wordcloud‘

    直接在cmd使用pip install wordcloud进行安装后,在jupyter notebook中导入wordcloud包会报错 发现是因为没有安装在anaconda的路径里 解决方法:打开anaconda prompt进行pip install wordcloud,安装完成后可以在jupyter环境中成功导入 去年这时候安过一次wordcloud包,当时好像也有这个问题,没有及时

    2024年02月11日
    浏览(45)
  • WordCloud库的安装教程

    1、查看与自己系统所匹配的WordCloud库的版本       在命令行中输入:pip debug --verbose 2、 下载对应版本的WordCloud文件          下载地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud       下载后将文件保存至Python Interpreter位置中: 3、下载完成后在命令行中执行安装命令  

    2024年02月03日
    浏览(29)
  • jieba和WordCloud

    词云图像 结果  

    2024年02月16日
    浏览(36)
  • python-wordcloud词云

    wordcloud以空格为分隔符号,来将文本分隔成单词 PIL pillow模块 这行代码使用imageio库读取一个名为“image.png”的图像文件,并将图像作为numpy数组存储在变量“img”中 dir可以查看一些东西 font_path :字体文件的路径 - - - 默认None width , height :词云生成图片的宽高 - - - 默认宽

    2024年02月09日
    浏览(37)
  • echarts-wordcloud词云

    echarts-wordcloud是基于echarts的一个插件,所以我们要首先安装echarts包,然后再安装echarts-wordcloud的包,这里我的练习项目安装的版本;当然,你可以随意安装你需要的版本; “echarts”: “^5.3.3”, “echarts-wordcloud”: “^2.0.0”, npm install echarts@5.3.3 npm install echarts-wordcloud@2.0.0 基本

    2024年01月22日
    浏览(37)
  • python--wordcloud库的使用

    目录 1.wordcloud库简介 2.wordcloud的基本使用 3.wordcloud使用实例(在图形中生成词云) 1.词云库简介 wordcloud库是python中的一个第三方库,wordcloud直译过来是“词云” 词云:以词语为基本单位,更加直观和艺术的展示文本。 另外词云库需要先自行安装 安装方法: 命令行安装:c

    2024年02月09日
    浏览(44)
  • WordCloud库简介与使用示例

    今天继续给大家介绍Python相关知识,本文主要内容是WordCloud库简介与使用示例。 WordCloud是一款Python的第三方库,可以用于生成词云。词云可以以词语为基本单位,然后根据词语的出现频率确定词语的大小,将所有这些词放到一张图片里,就可以更只管和艺术的展示文本。 我

    2023年04月08日
    浏览(32)
  • wordcloud Python中的词云库

    Python中的词云库是一个非常流行的文本可视化工具,可以将文本中的以词云形式呈现。本篇文章将详细讲解Python中的词云库的使用和API以及代码注释。 安装词云库 安装词云库的方式很简单,只需要在命令行中使用pip命令即可。具体命令如下所示: 导入词云库 导入词云

    2024年02月07日
    浏览(37)
  • python词云 wordcloud库详细使用教程

    “词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)于提出,词云是一种可视化描绘单词或词语出现在文本数据中频率的方式,它主要是由随机分布在词云图的单词或词语构成,出现频率较高的单词或词语则会以较大的形式呈现出来,而频

    2024年02月08日
    浏览(54)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包