Python绘制基础词云图

这篇具有很好参考价值的文章主要介绍了Python绘制基础词云图。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Python的词云制作。

词云介绍:

词云是对文本进行可视化呈现的一种方式,

词云出现的次数越多,字体越大,颜色越醒目,

可以通过词云快速获取文本的主要内容

给大家看一下词云绘制的效果:

python绘制词云图,python,信息可视化,python

 

python绘制词云图,python,信息可视化,python

 

用来绘制词云的第三方库:wordcloud,在导入前需要下载。

在绘制之前需要先创建一个词云对象,格式如下:

变量名 = wordcloud.WordCloud()

在括号里可以填写以下参数:

参数 作用
height 图片的宽,默认为400像素
width 图片的高,默认为200像素
font_path

字体设置,后缀名带".ttf",

例如: "simhei.ttf"

stopwords 停用词,后面会介绍
background_color

词云背景颜色,

默认为: black

colormap

词云色系设置

后面还需要”变量名.generate()“ 加载词云文本,括号里面填写要制作词云的内容,为

字符串。

colormap和background_color参数的设置,请看下面的图例:

python绘制词云图,python,信息可视化,python

 

最后再加上 "变量名.to_file()" 就可以保存生成的词云图片,括号里填写 图片名称,

后缀名可以是 ".png",".jpeg"。

在这里给大家介绍一下词云的运行方法:

1. 处理文本,将文本分割成一个一个词云。

2. 统计文本每个词语的出现次数。

3. 根据每个词语的次数配置字体大小和颜色。

4. 保存图片。

 

给大家展示一个案例:

 

import wordcloud

text = 'Word Cloud, or Tag Cloud is a visual representation of text data. Word Cloud could
 display a list of words. The size and color of each word in a Word Cloud indicates its 
frequency or importance in the text. In another word, significant textual data points can
 be highlighted using a Word Cloud. It is easy to generate a Word Cloud with Python. You 
simply need a library called wordcloud. After this class, you will be able to generate a 
beautiful Word Cloud.'


print('开始绘制词云...')

w = wordcloud.WordCloud(
    width=1000,
    height=600
)
w.generate(text)
w.to_file('词云1.png')

print('词云图片已生成')

看一下效果:

python绘制词云图,python,信息可视化,python

 

停用词的介绍:

在处理文本的时候,词云会自动筛选掉不是文本的主要信息的词语(仅限英文单词),

因此,在出现了许多次的单词没有出现在词云图的原因就是这个词语并不是文本的

主要信息。

如何获取wordcloud中的停用词:

print(wordcloud.STOPWORDS)

 结果为:

​
{'how', 'however', "what's", 'could', 'in', 'itself', 'hers', 'its', "where's", 'has',
 'if', "she's", 'once', 'she', 'having', "i'd", 'same', 'by', 'up', "can't", 'http', 
"there's", "haven't", 'and', "shouldn't", 'you', 'while', "he'll", 'out', 'what', "that's",
 'both', 'myself', "she'd", "they'll", 'cannot', "weren't", 'it', "they'd", "we're", 
'ours', 'as', "isn't", 'herself', 'then', 'whom', "when's", 'through', 'yourself', 'also',
 'yourselves', "we've", 'get', "hasn't", 'on', 'should', "here's", 'we', 'were', 'ought', 
'between', 'again', 'her', 'i', 'these', 'otherwise', 'his', 'after', 'than', 'are', 'the',
 'your', 'does', 'where', 'just', 'doing', 'being', 'too', 'do', 'com', 'few', 'that', 
'against', 'because', 'k', 'r', 'is', 'himself', 'under', 'here', 'any', 'themselves', 
'which', 'be', "hadn't", 'an', 'only', 'nor', 'ourselves', 'him', "he's", 'those', 'very', 
"wouldn't", 'other', "mustn't", 'their', 'with', 'into', "aren't", "i'm", 'of', "they've", 
'them', 'but', 'this', "we'll", "they're", 'would', 'ever', 'from', 'yours', "how's", 
'else', "you'll", 'to', "she'll", 'until', 'had', 'he', 'most', 'further', "you've", 
'like', "don't", 'more', 'some', 'there', "you're", "he'd", 'such', 'been', 'am', 'during', 
'about', 'all', 'why', 'when', 'shall', 'down', "it's", "let's", 'no', 'was', "why's", 
'can', 'who', 'each', 'at', 'before', "couldn't", 'have', "shan't", "who's", 'since', 
'theirs', 'below', 'they', "we'd", "you'd", "i'll", 'a', "doesn't", 'our', "wasn't", 'me', 
"didn't", "won't", 'my', 'hence', 'not', 'over', 'off', 'or', 'above', 'for', 'own', 'www',
 'did', 'therefore', 'so', "i've"}


​

可以看到,已经展示了所有的英文停用词。

因此,我们可以用一个停用词变量,将所有的停用词都添加到里面,

在WordCloud里面的停用词参数填写变量名。


绘制中文词云:

绘制中文词云可以使用中文分词第三方库"jieba"来实现,在开始需要先导入:

import jieba

来看以下案例:

​
import wordcloud
import jieba

text = '故今日之责任,不在他人,而全在我少年。少年智则国智,少年富则国富;少年强则国强,少年独立则国独立;少年自由则国自由;少年进步则国进步;少年胜于欧洲则国胜于欧洲;少年雄于地球,则国雄于地球。'

# 使用jieba库的lcut()命令进行分词
lst = jieba.lcut(text)
# 使用join()命令将列表 lst 用空格拼接成字符串
m = ' '.join(lst)

win = 'simhei.ttf'
w = wordcloud.WordCloud(
    width=1000,
    height=700,
    # 根据自己的电脑系统选择中文字体
    font_path= win,
    background_color='black',
    colormap='hsv'
)
# 加载由词语组成的文本
w.generate(m)
w.to_file('词云2.png')

print('词云图片已生成')

效果:

python绘制词云图,python,信息可视化,python

 再看一个案例:

import wordcloud
import jieba

text = '''好文章摘抄200字(一)
《奋斗的意义》
人的心理常常容易受到伤害的原因之一,就是要求事事都合理公平。所以才会有不少人产生"社会上都凭关系背
景,我奋斗又有什么用"的观点。其实,把事事都公平作为人类的理想而为之奋斗是应当的,但若把公平当成现
实的,则很幼稚。因为在现实世界里,不存在绝对的公平。不少年轻人遇到不公平的事,往往爱发牢骚、抱怨,
甚至有的人还将"不公平"作为自己消极无为、逃避现实的托词而不努力,结果丧失了许多转变命运的机会。
好文章摘抄200字(二)
《生命。健康》
最好的医生是自己,最好的的药物是时间,最好的的心情是宁静,最好的的保健是笑容,最好的运动是步行。
欢乐是长寿的妙药,勤奋是健康的灵丹,运动是健康的投资,长寿是健康的回报,相逢莫问留春术,谈泊宁静比
药好。
金钱难买健康,健康大于金钱,金钱难买幸福,幸福必有健康,生命的幸福不在名利在健康,身体的强壮不在金
钱在运动。
好文章摘抄200字(三)
《什么是心理健康》
健康是人类生存极为重要的内容,它对于人类的发展,社会的变革,文化的更新,生活方式的改变,有着决定性
的作用。那么,一个人怎样才算健康呢? 1948年世界卫生组织明确规定:健康不仅是身体没有疾病,而且应当
重视心理健康,只有身心健康、体魄健全,才是完整的健康。可见心理健康是人的健康不可分割的重要部分。
好文章摘抄200字(四)
《睡眠与记忆》
"睡眠是神经科学中一个比较神秘的现象,人为什么要睡眠一直是个谜。生理心理学家曾经持续剥夺动物的睡
眠,结果三周后动物就死亡了,在对死亡动物大脑解剖中也没有看到明显的损伤。人类睡眠是一个主动的过程,
研究发现睡眠和大脑的信息整理有关系。如果普通人连续几天不睡,记忆损伤确实会比较严重。"
好文章摘抄200字(五)
《希望》
希望与幻想不同。希望是很有可能实现的未来,幻想是不大可能实现的希望。在我们的生活中,常常破灭的不是
希望而是幻想。我们常常为实现不了的愿望而痛苦,是因为我们把幻想当成了希望。
因此当人在对一件事情的希望破灭之后,便会把希望转移到另一件事情上。转移的过程,往往是一个痛苦又无可
奈何的过程。因为转移是在无奈的情况下发生的,在情形有了某种改变之后,人往往会在心中重又燃起对以前的
希望之火。
好文章摘抄200字(六)
《希望是什么》
希望是什么?希望是失败者对成功的一种渴求;希望是死对生的一种企盼;希望是寒冬对春的一种向往。
希望是什么?希望是人生的钟摆,须臾停止不得;希望是太阳升起的地方,光芒四射。
如果低下头表示失望,那么昂起头便是希望。希望的路,千条万条;希望的河,处处可入海洋。
希望是什么?是优美动听的歌;是奇丽无比的小诗;是令人神往的意境;是朝露、晚虹、是阳光……
希望是你,你就是希望!
好文章摘抄300字(七)
《希望》
这以前,我的心也曾充满过血腥的歌声:血和铁,火焰和毒,恢复和报仇。而忽而这些都空虚了,但有时故意地
填以没奈何的自欺的希望。希望,希望,用这希望的盾,抗拒那空虚中的暗夜的袭来,虽然盾后面也依然是空虚
中的暗夜。在最悲伤的时刻,不能忘记信念。最幸福的时刻,不能忘记人生的坎坷。
好文章摘抄200字(八)
隐秘的河湾
历史,虽有庄严的面容,却很难抵拒假装学问的臆想、冒称严谨的偷换、貌似公平的掩饰、形同证据的伪造。它
因人们的轻信而成为舆论,因时间的易逝而难以辩驳,因文痞的无耻而延续谬误,因学者的怯懦而知错不纠。结
果,它所失落的,往往倒是社会进程中的一些最关键的隐秘。
尤其是历史转折时期的隐秘,更其复杂。这是一个最容易被人们忘记的时期,因为不管用转折前还是转折后的坐
标都无法读解它,而无法读解就无法记录。
历史的转折处大多并不美丽,就像河道的弯口上常常汇聚着太多的垃圾和泡沫。美丽的转折一定是修饰的结果,
而修饰往往是历史的改写。'''

text = jieba.lcut(text)
text = [i for i in text if len(i) > 1] #筛选掉不是词语的内容
text = ' '.join(text) #分割词语

w = wordcloud.WordCloud(
    width = 1000,
    height = 800,
    font_path = 'simhei.ttf',
    background_color = 'white',
    colormap = 'rainbow'
)

w.generate(text)
w.to_file(word_cloud[0]+'.png')

看一下效果:

python绘制词云图,python,信息可视化,python

 


以下就是全部内容,感谢观看!文章来源地址https://www.toymoban.com/news/detail-759865.html

到了这里,关于Python绘制基础词云图的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 数据可视化python,绘制饼图,代码和解析

    使用matplotlib.pyplot.pie绘制 (1),该函数的定义如下: matplotlib.pyplot.pie(x, explode=None, labels=None, colors=None, autopct=None, pctdistance=0.6, shadow=False, labeldistance=1.1, startangle=None, radius=None, counterclock=True, wedgeprops=None, textprops=None, center=(0, 0), frame=False, rotatelabels=False, hold=None, data=None) 参数说明:

    2024年02月06日
    浏览(46)
  • 【Python入门系列】第十五篇:Python数据可视化和图表绘制

    数据可视化是数据分析和数据科学中非常重要的一部分。通过可视化,我们可以更好地理解数据、发现数据之间的关系、展示数据的趋势和模式,并向他人传达我们的发现。 Python是一种功能强大的编程语言,拥有许多用于数据可视化的库和工具。其中,Matplotlib是最常用的绘

    2024年02月13日
    浏览(59)
  • 数据可视化——用python绘制简单的折线图

    前面我们已经学习了python的基础语法和面向对象,那么接下来我们将学习python编程语言的过人之处——数据的可视化之折线图。 说到数据可视化,我们需要先知道什么是JSON。 json是一种轻量级的数据交互格式,可以按照json指定的格式去组织和封装数据 json本质上是一个带有特

    2024年02月17日
    浏览(41)
  • 100天精通Python(可视化篇)——第110天:Pyecharts绘制可视化大屏项目(附上完整源码)

    🔥🔥 本文已收录于 《100天精通Python从入门到就业》:本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学,从0到100的不断进阶深入,后续还有实战项目,轻松应对面试,专栏订阅地址:https://blog.csdn.net/yua

    2024年02月04日
    浏览(43)
  • [数据分析与可视化] 基于Python绘制简单动图

    动画是一种高效的可视化工具,能够提升用户的吸引力和视觉体验,有助于以富有意义的方式呈现数据可视化。本文的主要介绍在Python中两种简单制作动图的方法。其中一种方法是使用matplotlib的Animations模块绘制动图,另一种方法是基于Pillow生成GIF动图。 Matplotlib的Animations模

    2024年02月03日
    浏览(41)
  • 【数据可视化】Python通过Pyecharts库绘制geo类地图

    我们知道,在数据可视化中的地图可视化分为map类地图和geo类地图,而现在我将介绍geo类地图,会对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着我来一起学习学习吧!(由于我是一位初学者,若有不对的还望大家多多指教,蟹蟹~) 中文官方文档和

    2024年02月04日
    浏览(62)
  • Python 数据可视化教程 - 如何使用 pyecharts 绘制多条折线图表

    部分数据来源: ChatGPT   引言         本文主要介绍如何使用 Python 中的 pyecharts 库,绘制多条折线图表。在本例中,我们将展示各国的 COVID-19 确诊人数数据。 1、首先,我们需要导入必要的库: 其中, json  库用于解析 JSON 数据, pyecharts  库用于绘图, TitleOpts 、 Lege

    2024年02月09日
    浏览(53)
  • 用Python绘制六种可视化图表,简直太好用了

    前言 嗨喽~大家好呀,这里是魔王呐 ❤ ~! python资料、源码、教程: 点击此处跳转文末名片获取 可视化图表,有相当多种,但常见的也就下面几种,其他比较复杂一点,大都也是基于如下几种进行组合,变换出来的。 对于初学者来说,很容易被这官网上众多的图表类型给吓着

    2024年02月10日
    浏览(52)
  • 论文图片绘制 Python绘制多分类混淆矩阵及可视化(颜色随正确率渐变)

    需求 论文中对多分类评价需要 混淆矩阵已获得,需要可视化 给出数据 混淆矩阵的定义以及如何读图不再描述,这里仅给出绘制方法 给出数据:8分类任务 实验代码 给出所需的包 numpy和matplotlib 定义分类标签 这里可以修改为自己所需的标签以及分类任务,如二分类只需要 两

    2024年02月12日
    浏览(37)
  • 数据可视化|Python之Pyecharts将“爬虫数据”绘制饼状图

    前言 本文是该专栏的第40篇,后面会持续分享python数据分析的干货知识,记得关注。 在项目中,可能有些同学或多或少遇见这样的需求。将爬虫采集下来的数据,进行图像可视化处理,方便其他业务线进行数据分析处理。 而本文,笔者将以某个 爬虫案例 的采集数据为例子,

    2024年01月18日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包