《PySpark大数据分析实战》-27.数据可视化图表Pyecharts介绍

这篇具有很好参考价值的文章主要介绍了《PySpark大数据分析实战》-27.数据可视化图表Pyecharts介绍。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

📋 博主简介

  • 💖 作者简介:大家好,我是wux_labs。😜
    热衷于各种主流技术,热爱数据科学、机器学习、云计算、人工智能。
    通过了TiDB数据库专员(PCTA)、TiDB数据库专家(PCTP)、TiDB数据库认证SQL开发专家(PCSD)认证。
    通过了微软Azure开发人员、Azure数据工程师、Azure解决方案架构师专家认证。
    对大数据技术栈Hadoop、Hive、Spark、Kafka等有深入研究,对Databricks的使用有丰富的经验。
  • 📝 个人主页:wux_labs,如果您对我还算满意,请关注一下吧~🔥
  • 📝 个人社区:数据科学社区,如果您是数据科学爱好者,一起来交流吧~🔥
  • 🎉 请支持我:欢迎大家 点赞👍+收藏⭐️+吐槽📝,您的支持是我持续创作的动力~🔥

《PySpark大数据分析实战》-27.数据可视化图表Pyecharts介绍

前言

大家好!今天为大家分享的是《PySpark大数据分析实战》第3章第4节的内容:数据可视化图表Pyecharts介绍。

《PySpark大数据分析实战》-27.数据可视化图表Pyecharts介绍,PySpark大数据分析实战,数据分析,数据挖掘,大数据,数据科学,PySpark

图书在:当当、京东、机械工业出版社以及各大书店有售!

Python数据可视化工具介绍

数据可视化是一种提取有价值数据的有效方法,是数据分析和机器学习中非常重要的一环。它有助于提高分析效率,为机器学习模型提供可靠的数据基础。它可以帮助人们更直观地理解数据,更好地理解数据的趋势和变化,发现潜在的联系,从而帮助人们更好地构建机器学习模型,提高模型的准确性。此外,数据可视化可以帮助人们更好地发现数据中的噪声和异常。通过可视化,可以更容易地发现噪声数据和异常情况,从而减少机器学习模型的误差。常用的Python数据可视化工具包括Matplotlib、Seaborn、Pyecharts等。

Pyecharts介绍

Echarts是一个由百度开源的流行的JavaScript可视化库,它提供了各种图表类型,例如柱状图、折线图、散点图、饼图、地图和热力图等,凭借着良好的交互性,得到了众多开发者的认可。Pyecharts是一个基于Python的可视化工具,它是Echarts的Python版本,用于创建各种交互式图表。Pyecharts提供了一个简单的API,使得人们可以轻松地创建高质量的交互式图表。它支持多种输出格式,包括HTML、PNG、PDF等。与其他Python可视化工具相比,Pyecharts的优点在于强大的交互性和精美的外观效果。可以通过移动鼠标、缩放、拖动等方式与图表进行交互,可以自定义图表的颜色、样式、字体等各种细节。
要在项目中使用Pyecharts,需要在Python环境中安装Pyecharts,命令如下:

$ pip install pyecharts

在使用时需要在Python脚本中导入具体的图形,代码如下:

from pyecharts.charts import xxx

其中,xxx代表具体的图形,例如折线图(Line)、柱状图(Bar)、饼图(Pie)等。

绘制柱状图

Pyecharts柱状图的类定义如下:

class Bar(
    # 初始化配置项,参考 `global_options.InitOpts`
    init_opts: opts.InitOpts = opts.InitOpts()
)

柱状图Bar提供了两个方法,add_xaxis()方法用来为柱状图添加x轴,该方法接收一个参数,用来指定x轴的数据项,方法定义如下:

def add_xaxis(
    # x轴数据项
    xaxis_data: Sequence
)

add_yaxis()方法用来为柱状图添加y轴,该方法至少需要两个参数,第1个参数用于指定图例名称,第2个参数用来指定y轴的数据项,其余参数可以保持默认值,方法定义如下:

def add_yaxis(
    # 系列名称,用于 tooltip 的显示,legend 的图例筛选。
    series_name: str,
    # 系列数据
    y_axis: Sequence[Numeric, opts.BarItem, dict]
)

在下面的案例中,以星期作为分类并添加3组随机数绘制了柱状图,代码如下:

from pyecharts.charts import Bar
import numpy as np

bar = (
    Bar(init_opts=opts.InitOpts(width="500px", height="300px"))
    .add_xaxis(["周一", "周二", "周三", "周四", "周五", "周六", "周日"])
    .add_yaxis("第1组", [np.random.randint(5, 15) for _ in range(7)])
    .add_yaxis("第2组", [np.random.randint(5, 15) for _ in range(7)])
    .add_yaxis("第3组", [np.random.randint(5, 15) for _ in range(7)])
)
bar.render()

执行代码,绘制的图形如图所示。

《PySpark大数据分析实战》-27.数据可视化图表Pyecharts介绍,PySpark大数据分析实战,数据分析,数据挖掘,大数据,数据科学,PySpark

绘制饼图

Pyecharts饼图的类定义如下:

class Pie(
    # 初始化配置项,参考 `global_options.InitOpts`
    init_opts: opts.InitOpts = opts.InitOpts()
)

饼图Pie提供了一个方法,add()方法用来为饼图添加数据项,该方法至少需要两个参数,第1个参数用于指定图例名称,第2个参数用于指定饼图的数据项,方法定义如下:

def add(
    # 系列名称,用于 tooltip 的显示,legend 的图例筛选。
    series_name: str,
    # 系列数据项,格式为 [(key1, value1), (key2, value2)]
    data_pair: types.Sequence[types.Union[types.Sequence, opts.PieItem, dict]]
)

在下面的案例中,使用Pyecharts的样例数据绘制饼图,代码如下:

from pyecharts import options as opts
from pyecharts.charts import Pie
from pyecharts.faker import Faker

pie = (
    Pie(init_opts=opts.InitOpts(width="500px", height="300px"))
    .add("", [list(z) for z in zip(Faker.choose(), Faker.values())])
)
pie.render()

执行代码,绘制的图形如图所示。

《PySpark大数据分析实战》-27.数据可视化图表Pyecharts介绍,PySpark大数据分析实战,数据分析,数据挖掘,大数据,数据科学,PySpark

绘制箱型图

Pyecharts箱型图的类定义如下:

class Boxplot(
    # 初始化配置项,参考 `global_options.InitOpts`
    init_opts: opts.InitOpts = opts.InitOpts()
)

箱型图Boxplot提供了两个方法,add_xaxis()方法用来为箱型图添加x轴,该方法接收一个参数,用来指定x轴的数据项,方法定义如下:

def add_xaxis(
    # x轴数据项
    xaxis_data: Sequence
)

add_yaxis()方法用来为箱型图添加y轴,该方法至少需要两个参数,第1个参数用于指定图例名称,第2个参数用来指定y轴的数据项,其余参数可以保持默认值,方法定义如下:

def add_yaxis(
    # 系列名称,用于 tooltip 的显示,legend 的图例筛选。
    series_name: str,
    # 系列数据
    y_axis: types.Sequence[types.Union[opts.BoxplotItem, dict]]
)

在下面的案例中,以星期作为分类并添加2组随机数绘制箱型图,代码如下:

from numpy.random import randint as rdi
from pyecharts import options as opts
from pyecharts.charts import Boxplot

d1 = [rdi(40 - rdi(1, 40), 60 + rdi(1, 40), 100).tolist() for _ in range(7)]
d2 = [rdi(40 - rdi(1, 40), 60 + rdi(1, 40), 100).tolist() for _ in range(7)]
box = Boxplot(init_opts=opts.InitOpts(width="500px", height="300px"))
box.add_xaxis(["周一", "周二", "周三", "周四", "周五", "周六", "周日"])
box.add_yaxis("第1组", box.prepare_data(d1))
box.add_yaxis("第2组", box.prepare_data(d2))
box.render()

执行代码,绘制的图形如图所示。

《PySpark大数据分析实战》-27.数据可视化图表Pyecharts介绍,PySpark大数据分析实战,数据分析,数据挖掘,大数据,数据科学,PySpark

结束语

好了,感谢大家的关注,今天就分享到这里了,更多详细内容,请阅读原书或持续关注专栏。文章来源地址https://www.toymoban.com/news/detail-820568.html

到了这里,关于《PySpark大数据分析实战》-27.数据可视化图表Pyecharts介绍的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【数据分析与可视化】利用Python对学生成绩进行可视化分析实战(附源码)

    需要源码和数据集请点赞关注收藏后评论区留言私信~~~ 下面对学生成句和表现等数据可视化分析 1:导入模块 2:获取数据 并打印前四行  属性列表对应含义如下 Gender  性别 Nationality  国籍 PlaceofBirth 出生地 Stageid 学校级别 Gradeid 年级 Sectionid  班级 Topic 科目 semester 学期 ra

    2024年02月03日
    浏览(35)
  • python 数据分析可视化实战 超全 附完整代码数据

    代码+数据:https://download.csdn.net/download/qq_38735017/87379914 1.1.1 异常值检测 ①将支付时间转为标准时间的过程中发生错误,经排查错误数据为‘2017/2/29’,后将其修改为‘2017/2/27’。 ②经检测发现部分订单应付金额与实付金额都为0,抹去这部分异常数据。 ③在检测过程中发现部

    2024年02月02日
    浏览(31)
  • MySQL实战项目:淘宝母婴购物数据可视化分析

    文章目录 前言 一、数据获取 1.母婴信息表:tianchi_mum_baby.csv 2.购物行为表: tianchi_mum_baby_trade_history.csv 二、数据预处理:  1.修改数据类型 2.检查重复数据: 3.检查空格 4.去异常 三.数据分析 1.流量分析 2.类别分析 3.性别分析 总结 母婴用品是淘宝的热门购物类目,随着国家鼓

    2024年02月04日
    浏览(53)
  • 【数据分析与可视化】pyecharts可视化图表讲解及实战(超详细 附源码)

    需要源码请点赞关注收藏后评论区留言私信~~~ pyecharts是基于Echart图表的一个类库,而Echart是百度开源的一个可视化JavaScript库 pyecharts主要基于web浏览器进行显示,绘制的图形比较多,包括折线图、柱状图、饼图、漏斗图、地图、极坐标图等,代码量很少,而且很灵活,绘制出

    2024年02月01日
    浏览(34)
  • [小尘送书-第二期]《Power BI数据分析与可视化实战》数据清洗、数据建模、数据可视化设计与高级技法

    大家好,我是小尘,欢迎你的关注!大家可以一起交流学习!欢迎大家在CSDN后台私信我!一起讨论学习,讨论如何找到满意的工作! 👨‍💻博主主页:小尘要自信 👨‍💻推荐专栏: 👨‍💻《1》开发环境配置攻略 👨‍💻《2》Java程序员的成长 👨‍💻《3》2023Java面试实

    2024年02月13日
    浏览(27)
  • Python 数据采集、清洗、整理、分析以及可视化实战

    大概可以分为下面这几个步骤: 数据采集; 原始数据完整性检查; 数据清洗、整理; 从不同角度对数据进行分析; 数据可视化; 总结; 主要使用 Python 来进行分析: 数据采集: 主要涉及的 python 库包括 requests,BeautifulSoup,csv,以及一些其他常用工具。 数据完整性检查: 包

    2024年02月09日
    浏览(39)
  • Spark实时数据流分析与可视化:实战指南【上进小菜猪大数据系列】

    上进小菜猪,沈工大软件工程专业,爱好敲代码,持续输出干货。 本文介绍了如何利用Apache Spark技术栈进行实时数据流分析,并通过可视化技术将分析结果实时展示。我们将使用Spark Streaming进行数据流处理,结合常见的数据处理和可视化库,实现实时的数据流分析和可视化展

    2024年02月07日
    浏览(34)
  • 大数据分析的Python实战指南:数据处理、可视化与机器学习【上进小菜猪大数据】

    上进小菜猪,沈工大软件工程专业,爱好敲代码,持续输出干货。 引言: 大数据分析是当今互联网时代的核心技术之一。通过有效地处理和分析大量的数据,企业可以从中获得有价值的洞察,以做出更明智的决策。本文将介绍使用Python进行大数据分析的实战技术,包括数据

    2024年02月08日
    浏览(45)
  • 【爬虫、数据可视化实战】以“人口”话题为例爬取实时微博数据并进行舆情分析

    近期在weibo上讨论的比较热的话题无非就是“人口”了。TaoTao也看了一些大家发的内容。但是感觉单纯的看文字内容不能很直观的反应出来大家的关切。索性就使用爬虫对数据进行爬取,同时结合着数据可视化的方式让数据自己开口说话。那么接下来就让我们使用技术进行分

    2024年01月23日
    浏览(35)
  • 微服务应用性能分析实战07 数据可视化:多数据源让 Grafana 监控报警更高效

    这一讲我将带领你学习可视化监控套件 Grafana。Grafana 是一个开源的数据可视化的平台,所以它既不会监控应用,也不会产生监控数据,更不会对接原始数据进行分析存储。 它仅专注数据可视化本身 。 本节内容,会先通过与上一节 Kibana 可视化套件对比,来讲述 Grafana 的核心

    2024年02月05日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包