【机器学习】可视化模块-seaborn详细教程

这篇具有很好参考价值的文章主要介绍了【机器学习】可视化模块-seaborn详细教程。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


一、Seaborn介绍

Seaborn是一个基于Python语言的数据可视化库,它能够创建高度吸引人的可视化图表,是在matplotlib库的基础上,提供了更为简便的API和更为丰富的可视化函数,使得数据分析与可视化变得更加容易。Seaborn的设计哲学是以美学为中心,致力于创建最佳的数据可视化,同时也保持着与Python生态系统的高度兼容性,可以轻松集成到Python数据分析以及机器学习的工作流程中.
特点:

  • 丰富的可视化函数:Seaborn拥有一系列丰富的可视化函数,能够创建多种类型的图表,包括折线图、柱状图、散点图、核密度图、热力图等等。
  • 简洁的API:Seaborn的API设计简洁,代码易读易写,让用户能够轻松地创建高质量的可视化图表。
  • 支持数据分组:Seaborn支持按照数据分组进行可视化,使得用户能够更好地分析数据的差异。
  • 自动化调整:Seaborn能够自动调整图表的各种参数,包括颜色、标签、坐标轴等等,使得用户能够更专注于数据分析。
  • 计算多变量间关系的面向数据集接口
  • 可视化类别变量的观测与统计
  • 可视化单变量或多变量分布并与其子数据集比较
  • 控制线性回归的不同因变量并进行参数估计与作图
  • 对复杂数据进行易行的整体结构可视化
  • 对多表统计图的制作高度抽象并简化可视化过程
  • 提供多个内建主题渲染 matplotlib 的图像样式
  • 提供调色板工具生动再现数据

二、使用前骤

1.安装

pip install seaborn

由于需要其他模块依赖,还需要安装

pip install numpy
pip install scipy
pip install pandas

2.导包

import numpy as np
import pandas as pd
from scipy import stats
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(style="darkgrid")

三、使用

1.统计关系

  • 散点图
data=sns.load_dataset('tips')
sns.relplot(x='total_bill',y='tip',data=data)
plt.show()

seaborn,python,机器学习,机器学习,python,数据分析
添加参数
hue ->颜色 style->风格 size->尺寸

sns.relplot(x='total_bill',y='tip',hue="smoker",style='darkgrid',size=10,data=data)

seaborn,python,机器学习,机器学习,python,数据分析

  • 折线图
data=np.random.rand(100)
sns.relplot(kind='line',data=data)

seaborn,python,机器学习,机器学习,python,数据分析

  • 显示与切面的多种关系
fmri=sns.load_dataset('fmri')
sns.relplot(x="timepoint", y="signal", hue="subject",
            col="region", row="event", height=4,
            kind="line", estimator=None, data=fmri)

seaborn,python,机器学习,机器学习,python,数据分析

2.分类关系

  • 热力图
unniform_data=np.random.rand(8,8)
#vim,vmax表示范围 ,center表示中心数据大小
heatmap=sns.heatmap(unniform_data,vmin=0,vmax=1,center=0)

seaborn,python,机器学习,机器学习,python,数据分析可以显示每个数据,增加间隔

  • annot是否显示数据,fmt字体格式,linewwidth间距,cmap调色板
flights=sns.load_dataset('flights')#读取航班数据
flights=flights.pivot("month",'year',"passengers")
#annot是否显示数据,fmt字体格式,linewwidth间距,cmap调色板
ax=sns.heatmap(flights,annot=True,fmt='d',linewidths=.5,cmap="YlGnBu")

seaborn,python,机器学习,机器学习,python,数据分析

  • 散点图
data=sns.load_dataset('tips')
sns.catplot(x="day", y="total_bill", data=data)

seaborn,python,机器学习,机器学习,python,数据分析

  • 箱线图
data=sns.load_dataset('tips')
sns.catplot(x='day',y='total_bill',kind='box',data=data)
plt.savefig('1.png')
plt.show()

seaborn,python,机器学习,机器学习,python,数据分析

data = sns.load_dataset("diamonds")
sns.catplot(x="cut", y="price", kind="boxen",
            data=data.sort_values("cut"))

seaborn,python,机器学习,机器学习,python,数据分析

  • 条形图
data = sns.load_dataset("titanic")
sns.catplot(x="alone", y="age", hue="class", kind="bar", data=data)

seaborn,python,机器学习,机器学习,python,数据分析

3.数据集的分布

  • 直方图并拟合
data= np.random.normal(size=100)
sns.distplot(data)

seaborn,python,机器学习,机器学习,python,数据分析

  • 核密度
    • numpy.random.multivariate_normal 是NumPy的一个函数,用于生成多元正态分布的随机样本。它接受两个必需参数:均值和协方差矩阵,并返回一个随机数样本数组,该数组的形状由第一个参数确定。
      具体地,如果您传递一个形状为 (n,) 的均值向量和一个形状为 (n, n) 的协方差矩阵,函数将生成一个形状为 (m, n) 的随机数样本数组,其中 m 是您希望生成的样本数。每一行是一个长度为 n 的向量,表示一个多元正态分布的样本。
      例如,以下代码将生成一个形状为 (100, 2) 的随机数样本数组,其中每一行表示一个二元正态分布的样本:
import numpy as np

mean = [0, 0]
cov = [[1, 0.5], [0.5, 1]]
samples = np.random.multivariate_normal(mean, cov, 100)

生成核密度图

mean, cov = [0, 1], [(1, .5), (.5, 1)]
data = np.random.multivariate_normal(mean, cov, 100)
df=pd.DataFrame(data,columns=['x','y'])
sns.jointplot(x="x", y="y", data=df, kind="kde")

seaborn,python,机器学习,机器学习,python,数据分析

  • 数据集中的成对关系
iris = sns.load_dataset("iris")
sns.pairplot(iris)

seaborn,python,机器学习,机器学习,python,数据分析

4.线性关系

  • 通过regplot()和lmplot()函数拟合回归模型y~x并绘制得到回归线和该回归的 95%置信区间
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(color_codes=True)
data=sns.load_dataset("tips")
sns.regplot(x='total_bill',y="tip",data=data)

seaborn,python,机器学习,机器学习,python,数据分析
当变量有离散值时候,可以拟合线性回归

sns.lmplot(x="size", y="tip", data=data)

seaborn,python,机器学习,机器学习,python,数据分析
由于可能得到不是最优解,所以可以添加噪音或者综合每个离散箱中的观测值,以绘制集中趋势的估计值和置信区间。

sns.lmplot(x="size", y="tip", data=data,x_jitter=0.04)

seaborn,python,机器学习,机器学习,python,数据分析

sns.lmplot(x="size", y="tip", data=data,x_estimator=np.mean)

seaborn,python,机器学习,机器学习,python,数据分析

5. 结构化构图

sns居于强大的网格图功能

  • 初始化网格
data=sns.load_dataset('tips')
g=sns.FacetGrid(data,col='time')

seaborn,python,机器学习,机器学习,python,数据分析

  • FacetGrid.map()是绘制网格数据的主要方法
data=sns.load_dataset('tips')
g=sns.FacetGrid(data,col='sex',hue='smoker')
g.map(plt.scatter,'tip','total_bill',alpha=0.9)

seaborn,python,机器学习,机器学习,python,数据分析

6.风格设置

seaborn内置了5种主题风格

  • darkgrid,whitegrid,dark,white , ticks
sns.set_style("whitegrid")#设置主题风格

可以根据喜好与情况选择,也可以自定义
通过给 axes_style() 与set_style()函数中的 rc 参数传递一个参数字典来实现,具体想深入研究,可以看文档
实例

sns.set_style("darkgrid", {"axes.facecolor": "0.6"})

总结

seaborn作为一个强大的可视化模块,在数据分析机器学习有很大的作用,但其功能远不在这里,如果想更加深入了解,可以访问其 官网地址或者中文文档
希望大家多多支持,一起努力学习,后续慢慢分享更多新奇有趣的东西文章来源地址https://www.toymoban.com/news/detail-641143.html

到了这里,关于【机器学习】可视化模块-seaborn详细教程的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Seaborn数据可视化(二)

    目录 1.Seaborn风格设置 1.1 主题设置 1.2 轴线设置  1.3 移除轴线  1.4 使用字典传递函数  2.设置绘图元素比例 2.1 设置绘图元素比例paper 2.2 设置绘图元素比例poster 2.3 设置绘图元素比例notebook Seaborn将Matplotlib的参数划分为两个独立的组合,第一组用于设置绘图的外观风格,第二

    2024年02月12日
    浏览(48)
  • 2. seaborn-可视化分类数据

    在 seaborn 中,有几种不同的方法可以对分类数据进行可视化。类似于 relplot() 与 scatterplot() 或者 lineplot() 之间的关系,有两种方法可以制作这些图。有许多 axes-level 函数可以用不同的方式绘制分类数据,还有一个 figure-level 接口 catplot() ,可以对它们进行统一的高级访问。 将不

    2024年01月25日
    浏览(47)
  • 基于Python机器学习算法农业数据可视化分析预测系统(完整系统源码+数据库+详细文档+论文+部署教程)

    基于python机器学习XGBoost算法农业数据可视化分析预测系统,旨在帮助农民和相关从业者更好地预测农作物产量,以优化农业生产。该系统主要包括四个功能模块。 首先,农作物数据可视化模块利用Echarts、Ajax、Flask、PyMysql技术实现了可视化展示农作物产量相关数据的功能。

    2024年04月27日
    浏览(42)
  • 数学建模——数据可视化seaborn

    数学建模——数据可视化seaborn 写作由来: 最近在准备数学建模美赛,在画图表的时候,之前一直用的是matplotlib,但是画出来总感觉不是很好看,而美赛挺注重文章的美观,所以找到了另一个实用的高级的Python包——seaborn。 概括 风格(style) 有5种风格 white,whitegrid,dark,darkgri

    2024年02月13日
    浏览(44)
  • 机器学习之利用线性回归预测波士顿房价和可视化分析影响房价因素实战(python实现 附源码 超详细)

    数据集和源码请点赞关注收藏后评论区留下QQ邮箱或者私信 线性回归是利用最小二乘函数对一个或多个因变量之间关系进行建模的一种回归分析,这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个变量的称为一元回归,大于一个变量的情况叫做多元回归。

    2024年01月21日
    浏览(51)
  • 深入 Seaborn:Python 数据可视化进阶

    在上一篇介绍 Seaborn 的文章中,我们讨论了一些基础的可视化工具,例如直方图,以及如何使用 Seaborn 控制图形的样式和颜色。在这篇文章中,我们将深入 Seaborn 的中级使用,包括创建复杂的统计图形,如散点图矩阵、箱线图和小提琴图等。 Seaborn 的 pairplot 函数可以创建一个

    2024年02月16日
    浏览(44)
  • Seaborn——可视化的具体API应用

    一、Seaborn概述         Seaborn 是基于 matplotlib的图形可视化 python包。提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。         Seaborn在 matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn能做出很具有

    2024年01月16日
    浏览(33)
  • 初探 Seaborn:Python 数据可视化入门

    Seaborn 是一个基于 Matplotlib 的 Python 数据可视化库,它提供了更高级别的接口,使得创建美观的统计图形变得非常简单。在这篇文章中,我们将讨论 Seaborn 的基础使用方法,包括如何创建各种常见的统计图形。 首先,我们需要安装 Seaborn 库。这可以通过 pip 安装: 安装完成后

    2024年02月17日
    浏览(52)
  • 数据分析——seaborn可视化(笔记自用)

     参考内容  【Python】一小时带你掌握seaborn可视化_哔哩哔哩_bilibili 目录 一、变量分布  1、查看异常值  2、观察变量分布  3、figure-level functions具有FacetGrid特性  二、数值变量的关系分析  1、sns.relplot(): 2、sns.lmplot():分析两个变量的线性关系 3、sns.displot():绘制两个变量的联

    2023年04月08日
    浏览(39)
  • Python 数据可视化:Seaborn 库的使用

    ✅作者简介:人工智能专业本科在读,喜欢计算机与编程,写博客记录自己的学习历程。 🍎个人主页:小嗷犬的个人主页 🍊个人网站:小嗷犬的技术小站 🥭个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。 Seaborn 是一个基于 Python 的数据可视化库,它

    2024年02月07日
    浏览(46)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包