Python 数据可视化-文本可视化(词云图)

这篇具有很好参考价值的文章主要介绍了Python 数据可视化-文本可视化(词云图)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

这篇文章主要是教大家如何制作一个自定义个性化词云图,具体要求如下:

1.    文本内容使用文件content.txt的内容。如下图所示:

python词云图字体,数据可视化,python,pycharm,大数据

2.    字体任意选取。这里我选择的是极影毁片辉宋字体

python词云图字体,数据可视化,python,pycharm,大数据 

3.    指定词云形状为文件222.png。如下图所示:

 python词云图字体,数据可视化,python,pycharm,大数据

4.    设置文字颜色以背景图片色为参考。

5.    指定“的”、“了”、“就”为词云排除词。

6.    将制作好的词云保存为ciyun.png文件。

那么以上要求如何进行实现呢?接下来让我们用6步来搞定它!

第一步:安装相关库

import jieba
from wordcloud import WordCloud
from wordcloud import ImageColorGenerator
import matplotlib.pyplot as plt
import numpy as np
from PIL import Image  # Image模块是在Python PIL图像处理常用的模块

第二步:图像轮廓设定

picture = Image.open("E:\数据可视化\文本可视化\\222.png")  # 打开图片路径,形成轮廓
shape = np.array(picture)  # 图像轮廓转换为数组
image_colors = ImageColorGenerator(shape)  # 提取图片色彩

第三步:文本设定

with open("E:\数据可视化\文本可视化\content.txt", 'r', encoding='utf-8') as f:
    text = f.read()  # 设置输入为中文字符
cut_text = " ".join(jieba.cut(text))  # 使用jieba全模式进行中文分词

第四步:设置停用词

# 设置停用词
stop_words = ['的', '了', '就']
ciyun_words = ''
# 经过过滤后的词
for word in cut_text:
    if word not in stop_words:
        ciyun_words += word

第五步:词云图参数设定

cloud = WordCloud(
    mask=shape,  # 图片背景
    font_path="E:\数据可视化\文本可视化\ziti.ttf",
    background_color="white",
    max_words=4000,
    max_font_size=100
).generate(ciyun_words)  # 选定的绘制词云图的文本

第六步:绘制与保存

plt.figure(figsize=[10, 10])
plt.imshow(cloud.recolor(color_func=image_colors))
plt.axis('off')
# cloud.to_file("ciyun.png")
plt.savefig('ciyun.png')

最终结果:

最终运行完的词云图就展现出来啦!是不是很简单呢!如果有问题欢迎大家留言,我们一起讨论!

 python词云图字体,数据可视化,python,pycharm,大数据

 文章来源地址https://www.toymoban.com/news/detail-542019.html

到了这里,关于Python 数据可视化-文本可视化(词云图)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Python-Python基础综合案例:数据可视化 - 折线图可视化

    当前版本号[20230729]。 版本 修改说明 20230729 初版 效果一:2020年印美日新冠累计确诊人数 ​ 2020年是新冠疫情爆发的一年, 随着疫情的爆发, 国内外确诊人数成了大家关心的热点, 相信大家都有看过类似的疫情报告. 本案例对印度美国日本三个国家确诊人数的进行了可视化处理

    2024年02月15日
    浏览(48)
  • 大数据可视化——基于Python豆瓣电影数据可视化分析

    本项目旨在通过对豆瓣电影数据进行综合分析与可视化展示,构建一个基于Python的大数据可视化系统。通过数据爬取收集、清洗、分析豆瓣电影数据,我们提供了一个全面的电影信息平台,为用户提供深入了解电影产业趋势、影片评价与演员表现的工具。项目的关键步骤包括

    2024年02月04日
    浏览(75)
  • 【python可视化大屏】使用python实现可拖拽数据可视化大屏

    我在前几期分享了关于爬取weibo评论的爬虫,同时也分享了如何去进行数据可视化的操作。但是之前的可视化都是单独的,没有办法在一个界面上展示的。这样一来呢,大家在看的时候其实是很不方便的,就是没有办法一目了然的看到数据的规律。为了解决这个问题我使用p

    2024年02月03日
    浏览(60)
  • Python毕业设计 抖音短视频数据分析与可视化 - python 大数据 可视化

    🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。 为了大家能够顺利以及最少的精力通过毕设,学长分享优质毕业设计项目,今天

    2024年02月02日
    浏览(42)
  • 83 | Python可视化篇 —— Bokeh数据可视化

    Bokeh 是一种交互式数据可视化库,它可以在 Python 中使用。它的设计目标是提供一个简单、灵活和强大的方式来创建现代数据可视化,同时保持良好的性能。Bokeh 支持多种图表类型,包括线图、散点图、柱状图、饼图、区域图、热力图等。此外,它还支持将这些图表组合在一

    2024年02月13日
    浏览(42)
  • 81 | Python可视化篇 —— Seaborn数据可视化

    Seaborn是Python中一个基于Matplotlib的高级数据可视化库,它提供了更简单的API和更美观的图形样式,适用于数据探索和展示。在本教程中,我们将介绍Seaborn的基本概念和用法,并通过一些示例演示如何使用Seaborn来创建各种图表和图形。

    2024年02月14日
    浏览(38)
  • 大数据可视化——基于Python豆瓣电影数据可视化分析系统

    本项目旨在通过对豆瓣电影数据进行综合分析与可视化展示,构建一个基于Python的大数据可视化系统。通过数据爬取收集、清洗、分析豆瓣电影数据,我们提供了一个全面的电影信息平台,为用户提供深入了解电影产业趋势、影片评价与演员表现的工具。项目的关键步骤包括

    2024年01月21日
    浏览(56)
  • python毕设选题 - 大数据二手房数据爬取与分析可视化 -python 数据分析 可视化

    # 1 前言 🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。 为了大家能够顺利以及最少的精力通过毕设,学长分享优质毕业设计项

    2024年01月20日
    浏览(61)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包