葡萄酒数据可视化分析

7月前作者：IT小辉同学分类：Toy博客阅读(89) 违法举报

这篇具有很好参考价值的文章主要介绍了葡萄酒数据可视化分析。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

葡萄酒数据可视化分析

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘必应壁纸供图

数据集：https://download.csdn.net/download/weixin_53742691/87982219

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

wine = pd.read_csv("wine_quality/wine_edited.csv")
wine.head()

	fixed acidity	volatile acidity	citric acid	residual sugar	chlorides	free sulfur dioxide	total sulfur dioxide	density	pH	sulphates	alcohol	quality	color	alcohol_level	acidity_level
0	7.4	0.70	0.00	1.9	0.076	11.0	34.0	0.9978	3.51	0.56	9.4	5	red	low	low
1	7.8	0.88	0.00	2.6	0.098	25.0	67.0	0.9968	3.20	0.68	9.8	5	red	low	mod_high
2	7.8	0.76	0.04	2.3	0.092	15.0	54.0	0.9970	3.26	0.65	9.8	5	red	low	medium
3	11.2	0.28	0.56	1.9	0.075	17.0	60.0	0.9980	3.16	0.58	9.8	6	red	low	mod_high
4	7.4	0.70	0.00	1.9	0.076	11.0	34.0	0.9978	3.51	0.56	9.4	5	red	low	low

wine.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 6497 entries, 0 to 6496
Data columns (total 15 columns):
 #   Column                Non-Null Count  Dtype  
---  ------                --------------  -----  
 0   fixed acidity         6497 non-null   float64
 1   volatile acidity      6497 non-null   float64
 2   citric acid           6497 non-null   float64
 3   residual sugar        6497 non-null   float64
 4   chlorides             6497 non-null   float64
 5   free sulfur dioxide   6497 non-null   float64
 6   total sulfur dioxide  6497 non-null   float64
 7   density               6497 non-null   float64
 8   pH                    6497 non-null   float64
 9   sulphates             6497 non-null   float64
 10  alcohol               6497 non-null   float64
 11  quality               6497 non-null   int64  
 12  color                 6497 non-null   object 
 13  alcohol_level         6497 non-null   object 
 14  acidity_level         6496 non-null   object 
dtypes: float64(11), int64(1), object(3)
memory usage: 761.5+ KB

单一变量的可视化

sns.countplot(x='color',data=wine);

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘

sns.countplot(x='acidity_level',data=wine);

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘

sns.countplot(x='quality',data=wine);

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘

sns.color_palette()

base_color = sns.color_palette()[0]
sns.countplot(x='color',data=wine,color=base_color);

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘

sns.countplot(x='quality',data=wine,color=base_color);

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘

sns.countplot(y='acidity_level',data=wine,color=base_color);

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘

 wine.acidity_level.value_counts()

high        1717
mod_high    1643
low         1574
medium      1562
Name: acidity_level, dtype: int64

ph_order = wine.acidity_level.value_counts().index
sns.countplot(y='acidity_level',data=wine,color=base_color,order=ph_order);

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘

sns.countplot(x='acidity_level',data=wine,color=base_color,order=ph_order);

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘

sns.countplot(x='acidity_level',data=wine,color=base_color,order=ph_order);

acidity_class = wine['acidity_level'].value_counts()
locs,lables = plt.xticks()

for i in range(len(locs)):
    put_string = acidity_class[i]
    plt.text(locs[i],put_string-100,put_string,color='white',ha='center')

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘

sns.countplot(y='acidity_level',data=wine,color=base_color,order=ph_order);

acidity_class = wine['acidity_level'].value_counts()
locs,lables = plt.yticks()

for i in range(len(locs)):
    put_string = acidity_class[i]
    plt.text(put_string+100,locs[i],put_string,ha='center')

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘

alcohol_data = wine.alcohol_level.value_counts().reset_index()
alcohol_data = alcohol_data.rename(columns={'index':'alcohol_level','alcohol_level':'alcohol_counts'})
alcohol_data

	alcohol_level	alcohol_counts
0	high	3320
1	low	3177

sns.barplot(x='alcohol_level',y='alcohol_counts',data=alcohol_data,color=base_color);

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘

plt.pie(alcohol_data.alcohol_counts,labels=alcohol_data.alcohol_level,startangle=90)
plt.show()

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘

acidity_class = wine['acidity_level'].value_counts().reset_index()
acidity_class = acidity_class.rename(columns={'index':'acidity_level','acidity_level':'level_counts'})
acidity_class

	acidity_level	level_counts
0	high	1717
1	mod_high	1643
2	low	1574
3	medium	1562

plt.pie(acidity_class.level_counts,labels=acidity_class.acidity_level,startangle=90)
plt.show()

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘

plt.pie(acidity_class.level_counts,labels=acidity_class.acidity_level,startangle=90,wedgeprops={'width':0.4})
plt.show()

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘

wine.describe()

	fixed acidity	volatile acidity	citric acid	residual sugar	chlorides	free sulfur dioxide	total sulfur dioxide	density	pH	sulphates	alcohol	quality
count	6497.000000	6497.000000	6497.000000	6497.000000	6497.000000	6497.000000	6497.000000	6497.000000	6497.000000	6497.000000	6497.000000	6497.000000
mean	7.215307	0.339666	0.318633	5.443235	0.056034	30.525319	115.744574	0.994697	3.218501	0.531268	10.491801	5.818378
std	1.296434	0.164636	0.145318	4.757804	0.035034	17.749400	56.521855	0.002999	0.160787	0.148806	1.192712	0.873255
min	3.800000	0.080000	0.000000	0.600000	0.009000	1.000000	6.000000	0.987110	2.720000	0.220000	8.000000	3.000000
25%	6.400000	0.230000	0.250000	1.800000	0.038000	17.000000	77.000000	0.992340	3.110000	0.430000	9.500000	5.000000
50%	7.000000	0.290000	0.310000	3.000000	0.047000	29.000000	118.000000	0.994890	3.210000	0.510000	10.300000	6.000000
75%	7.700000	0.400000	0.390000	8.100000	0.065000	41.000000	156.000000	0.996990	3.320000	0.600000	11.300000	6.000000
max	15.900000	1.580000	1.660000	65.800000	0.611000	289.000000	440.000000	1.038980	4.010000	2.000000	14.900000	9.000000

plt.hist(data=wine,x='pH')
plt.show()

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘

import numpy as np
bin_edges = np.arange(wine.pH.min(),wine.pH.max()+0.05,0.05)
len(bin_edges )

plt.hist(data=wine,x='pH',bins=bin_edges)
plt.show()

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘

bin_edges = np.arange(0.0,0.125+0.005,0.005)
plt.hist(data=wine,x='chlorides',bins=bin_edges)
plt.xlim((0.0,0.125))
plt.show()

葡萄酒数据可视化分析,庖丁解牛,匠心独运,信息可视化,数据分析,数据挖掘文章来源地址https://www.toymoban.com/news/detail-515813.html

到了这里，关于葡萄酒数据可视化分析的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

为葡萄酒数据集构造SVM分类器和使用随机森林回归模型预测葡萄酒质量

目录前言一、实验目的二、实验环境三、实验内容与结果 1、SVM(support vector Machine)是什么？ 2、SVM能干什么？ 3、SVM如何实现？ 4、独热编码：独热编码（One-Hot Encoding） - 知乎 5、随机森林算法的基本原理四、模型构建 1、读入数据 2、数据初始化 3、训练模型，评价分类器

2023年04月25日
浏览(30)
【数学建模】国赛真题分析 2012 A题葡萄酒的评价

优秀论文地址：链接：https://pan.baidu.com/s/19WGpybgM6RncxTYhx61JRA?pwd=vl22 提取码：vl22 –来自百度网盘超级会员V6的分享确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分，然后求和得到其总分，从而确定葡萄酒的

2024年02月12日
浏览(42)
【数据挖掘】基于粒子群算法优化支持向量机PSO-SVM对葡萄酒数据集进行分类

PSO是粒子群优化算法（Particle Swarm Optimization）的英文缩写，是一种基于种群的随机优化技术，由Eberhart和Kennedy于1995年提出。粒子群算法是模仿昆虫、兽群、鸟群和鱼群等的群集行为，这些群体按照一种合作的方法寻找食物，群体中的每个成员通过学习它自身的经验和其他成员

2024年02月02日
浏览(44)
基于K近邻的葡萄酒质量检测项目

💥 项目专栏：【机器学习项目实战案例目录】项目详解 + 完整源码 🌠 『精品学习专栏导航帖』 🐳

2024年02月03日
浏览(31)
使用python实现葡萄酒威士忌风味特征分类

目的和描述：苏格兰威士忌因其复杂性和多样化的风味而备受推崇。据信，生产它的苏格兰地区具有独特的风味特征。在本案例研究中，我们将根据苏格兰威士忌的风味特征对其进行分类。我们将使用的数据集包含来自几个酿酒厂的精选苏格兰威士忌，我们将尝试将威士忌聚

2024年02月01日
浏览(26)
仅记录我的第一次数学建模——葡萄酒的评价

仅以此来记录我的数学建模课小组作业 2022.11.3周四运动会放假，终于有时间做数学建模啦（月底就要答辩了，今日数学建模小组作业进度2.6666%， 2022.11.23哈哈哈哈哈哈终于写完了，但！ tm查重30% 要求20%，累了，改不动了，开摆（真服了，为啥找个负责有能力的队友比世界

2024年02月12日
浏览(29)
2012年数学建模国赛A题(葡萄酒质量评价)优秀论文.doc

本博客下载链接包含修改的word版本, 可免费下载阅览学习, 也可作为数学建模相关课程作业修改上交: 链接：https://pan.baidu.com/s/1JaNsp6aVhl0xLuESsKwv4Q?pwd=qtnc 提取码：qtnc 葡萄酒的评价摘要如今葡萄酒逐渐成为人们越来越喜爱的饮品。本文主要针对葡萄酒的评价问题，利用

2024年02月11日
浏览(37)
python数据分析及可视化（十四）数据分析可视化练习-上市公司可视化数据分析、黑色星期五案例分析

从中商情报网下载的数据，表格中会存在很多的问题，查看数据的信息有无缺失，然后做数据的清晰，有无重复值，异常数据，省份和城市的列名称和数据是不对照的，删除掉一些不需要的数据，省份不完整的数据，然后进行数据分析以及可视化，如上市公司中的行业Top5，用

2024年02月03日
浏览(44)
【数据挖掘与人工智能可视化分析】可视化分析：如何通过可视化技术进行数据挖掘和发现

作者：禅与计算机程序设计艺术数据挖掘(Data Mining)和人工智能(Artificial Intelligence,AI)已经成为当今社会热点话题。这两者之间的结合也带来了很多挑战。作为数据科学家、机器学习工程师、深度学习研究员等，掌握了数据的获取、清洗、处理、建模、应用这些技术的前提下，

2024年02月07日
浏览(60)
大数据可视化——基于Python豆瓣电影数据可视化分析

本项目旨在通过对豆瓣电影数据进行综合分析与可视化展示，构建一个基于Python的大数据可视化系统。通过数据爬取收集、清洗、分析豆瓣电影数据，我们提供了一个全面的电影信息平台，为用户提供深入了解电影产业趋势、影片评价与演员表现的工具。项目的关键步骤包括

2024年02月04日
浏览(56)