汽车分析,随时间变化的燃油效率

这篇具有很好参考价值的文章主要介绍了汽车分析,随时间变化的燃油效率。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言:

在当今快速发展的科技时代,汽车不仅是交通工具,更是科技和工程的结晶。随着社会对可持续性和环境友好的关注不断增加,燃油效率成为汽车设计和制造中的一个关键议题。一辆车的燃油效率不仅关系到驾驶者的经济负担,还直接影响到环境的可持续性。本文将深入分析汽车燃油效率,并着眼于这一指标随着时间的推移所经历的变化。通过揭示背后的技术创新、市场趋势以及制度变革,我们将追溯汽车燃油效率的发展历程,以期带领读者深入了解这个引人注目的领域。

简述

今天我们来分析一个汽车数据。
数据集由以下列组成:

  • 名称:每辆汽车的唯一标识符。
  • MPG:燃油效率,以英里/加仑为单位。
  • 气缸数:发动机中的气缸数。
  • 排量:发动机排量,表示其大小或容量。
  • 马力:发动机的功率输出。
  • 重量:汽车的重量。
  • 加速:提高速度的能力,以秒为单位。
  • 车型年份:汽车模型的制造年份。
  • 原产地:每辆汽车的原产地国家或地区。
    总的来看数据内容不是很多,分析起来还是很容易的。

目标

这个项目的主要目标是了解汽车的不同特性之间的关系,以及它们如何影响燃油效率(MPG -每加仑英里数)。该项目还旨在发现数据中任何有趣的趋势或模式,从而为汽车行业提供见解。

数据清理和预处理

# 导入库
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = 'SimHei' ## 设置中文显示

from scipy.stats import f_oneway

from scipy.stats import ttest_ind

# 导入数据
df = pd.read_csv('D:桌面\\Automobile.csv',encoding='gbk')

汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python

检查所有列的数据类型

汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python

检查缺失值

汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python

箱型图

df['马力'] = df['马力'].fillna(df['马力'].mean())
# 数字列列表
num_cols = ['mpg', '气缸数', '排量', '马力', '重量', '加速', '车型年份']

for col in num_cols:
    plt.figure(figsize=(8, 4))
    sns.boxplot(df[col])
    plt.title(f'{col}箱线图 ')
    plt.show()

汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python

汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python
汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python
汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python
汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python
汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python
汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python

处理 ‘马力’ 中的异常值

首先,计算“马力”(horsepower)的四分位距(IQR)

Q1_hp = df['马力'].quantile(0.25)
Q3_hp = df['马力'].quantile(0.75)
IQR_hp = Q3_hp - Q1_hp

定义异常值的上限和下限。

lower_bound_hp = Q1_hp - 1.5 * IQR_hp
upper_bound_hp = Q3_hp + 1.5 * IQR_hp

将异常值限制在一定范围内。

df['马力'] = df['马力'].clip(lower=lower_bound_hp, upper=upper_bound_hp)

重复这个过程,针对“重量”

Q1_weight = df['重量'].quantile(0.25)
Q3_weight = df['重量'].quantile(0.75)
IQR_weight = Q3_weight - Q1_weight

lower_bound_weight = Q1_weight - 1.5 * IQR_weight
upper_bound_weight = Q3_weight + 1.5 * IQR_weight

df['重量'] = df['重量'].clip(lower=lower_bound_weight, upper=upper_bound_weight)

特征工程

创建一个新的特征’hp_to_weight’,它是马力与重量的比率。

df['hp_to_weight'] = df['马力'] / df['重量']

检查前几行 DataFrame 以确认更改。


df.head()

汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python

生成数值变量的描述性统计数据。


df.describe()

汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python

数据可视化

生成数值变量的直方图。


num_cols = ['mpg', '气缸数', '排量', '马力', '重量', '加速', '车型年份', 'hp_to_weight']

for col in num_cols:
    plt.figure(figsize=(8, 4))
    sns.histplot(df[col], kde=True)
    plt.title(f' {col}直方图')
    plt.show()

汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python
汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python
汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python
汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python
汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python
汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python
汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python
汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python

生成分类变量的条形图


plt.figure(figsize=(8, 4))
sns.countplot(x='原产地', data=df)
plt.title('原产地条形图')
plt.show()

汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python

双变量分析

为成对的数值变量生成散点图


num_cols = ['mpg', '气缸数', '排量', '马力', '重量', '加速', '车型年份', 'hp_to_weight']

sns.pairplot(df[num_cols])
plt.show()

汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python

数值变化的相关矩阵

#计算数值变量之间的相关系数。
corr_matrix = df[num_cols].corr()

# 显示相关矩阵
sns.heatmap(corr_matrix, annot=True, cmap='coolwarm')
plt.title('数值变化的相关矩阵')
plt.show()

汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python

group1 = df[df['原产地'] == 'usa']['mpg']
group2 = df[df['原产地'] == 'europe']['mpg']
group3 = df[df['原产地'] == 'japan']['mpg']

# 进行单因素方差分析。
f_stat, p_value = f_oneway(group1, group2, group3)

# 输出  F-statistic 和 p-value
print(f'F-statistic: {f_stat}')
print(f'p-value: {p_value}')

汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python

多变量分析

生成一组变量的配对图。

subset_cols = ['mpg', '马力', '重量', '原产地']
sns.pairplot(df[subset_cols], hue='原产地')
plt.show()

汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python

时间分析

# 计算每个型号年份的平均每加仑英里数。
avg_mpg_by_year = df.groupby('车型年份')['mpg'].mean()

# 绘制随着时间变化的平均每加仑英里数。
plt.figure(figsize=(10, 6))
sns.lineplot(data=avg_mpg_by_year)
plt.title('平均每加仑英里数按车型年份分类')
plt.xlabel('车型年份')
plt.ylabel(' MPG平均值')
plt.show()

汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python

假设检验

# 删除具有缺失“mpg”值的行。
df = df.dropna(subset=['mpg'])

# 将数据分成两组。
group1 = df[df['车型年份'] < 75]['mpg']  # 1975年之前制造的汽车
group2 = df[df['车型年份'] >= 75]['mpg']  # 1975年之后制造的汽车

# 进行双样本t检验。
from scipy.stats import ttest_ind
t_stat, p_value = ttest_ind(group1, group2)

# 输出 the t-statistic the p-value
print(f't-statistic: {t_stat}')
print(f'p-value: {p_value}')

汽车分析,随时间变化的燃油效率,数据解析之旅:发现信息的奥秘,汽车,数据分析,python

结论

  • 随着时间的推移,燃油效率:平均每加仑英里数(mpg)似乎随着时间的推移而增加,这表明汽车变得更加省油。这可能是由于技术的进步和汽车制造业对燃油效率的日益关注。

  • 马力和重量:马力和重量之间似乎存在正相关关系,表明较重的汽车往往拥有更强劲的发动机。然而,马力和重量似乎都与mpg负相关,这表明较重的汽车和发动机功率更大的汽车往往更省油。

  • 产地和燃油效率:我们的假设检验表明,不同产地的汽车平均每加仑汽油行驶里程有显著差异。这表明汽车的生产地区可能会对其燃油效率产生影响。

  • 新功能-马力重量比:我们创造的新功能,马力重量比,可能会为这些变量和mpg之间的关系提供不同的结果

随着时间的推移,汽车燃油效率的不断提高不仅是技术进步的体现,更是对环境可持续性的一项积极贡献。我们目睹着科技创新如何推动着整个汽车行业向更加高效、清洁的方向迈进。未来,随着新能源技术的不断涌现和社会对可持续发展的日益关注,汽车燃油效率将继续成为引领汽车产业前行的关键驱动力。希望通过本文的深度分析,读者能够对汽车燃油效率的演变有更清晰的认识文章来源地址https://www.toymoban.com/news/detail-618097.html

到了这里,关于汽车分析,随时间变化的燃油效率的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 数据可视化:随时间变化的效果图

    获取北京、上海、江苏、广东四省的2008—2012年的GDP数据 在Jupyter Notebook上实现代码如下:

    2023年04月12日
    浏览(45)
  • Docker 基础知识解析:容器与传统虚拟化对比:资源利用、启动时间、隔离性和部署效率

    🌷🍁 博主 libin9iOak带您 Go to New World.✨🍁 🦄 个人主页——libin9iOak的博客🎐 🐳 《面试题大全》 文章图文并茂🦕生动形象🦖简单易学!欢迎大家来踩踩~🌺 🌊 《IDEA开发秘籍》学会IDEA常用操作,工作效率翻倍~💐 🪁🍁 希望本文能够给您带来一定的帮助🌸文章粗浅,敬

    2024年02月16日
    浏览(57)
  • JVM逃逸分析原理解析:优化Java程序性能和内存利用效率

    在Java开发中,性能和内存利用效率一直是开发者关注的焦点。为了提高Java程序的执行效率,JVM引入了逃逸分析技术。本文将详细解析JVM逃逸分析的原理,帮助读者深入理解其工作机制。 逃逸分析是一种用于确定对象在方法的生命周期内是否逃逸出方法外部范围的技术。在

    2024年01月20日
    浏览(57)
  • 【MySQL】嵌套查询—数据之旅:解析层层嵌套的迷思

    🎊专栏【MySQL】 🌺每日一句:宝剑锋从磨砺出,梅花香自苦寒来 ⭐欢迎并且感谢大家指出我的问题 文章目录 嵌套查询 (1)不相关子查询(带有IN谓词的子查询) 🍔定义 🍔使用说明 🍔特点 🍔实际操作 🍔三层嵌套查询 (2)相关子查询(带有EXISTS谓词的子查询) 🍔定义 🍔使用说明

    2024年02月05日
    浏览(41)
  • 【数据结构】算法效率揭秘:时间与空间复杂度的较量

    在计算机科学中,时间复杂度和空间复杂度是衡量算法性能的两个重要指标。它们分别表示算法在执行过程中所需的时间和空间资源。了解这两个概念有助于我们评估和比较不同算法的优劣,从而选择更合适的算法解决问题~ 欢迎关注个人主页:逸狼 创造不易,可以点点赞吗

    2024年04月28日
    浏览(41)
  • Hive数据分析案例——汽车销售数据分析

    使用HiveQL实现来实现,本数据为上牌汽车的销售数据,分为乘用车辆和商用车辆。数据包含销售相关数据与汽车具体参数。数据项包括:时间、销售地点、邮政编码、车辆类型、车辆型号、制造厂商名称、排量、油耗、功率、发动机型号、燃料种类、车外廓长宽高、轴距、前

    2024年02月09日
    浏览(162)
  • 畅想未来感汽车HMI设计的奇妙之旅!

    当下智能电动汽车的发展势头越来越高涨,与智能电动汽车相关的汽车HMI设计也成为各个品牌重点发力的地方,汽车HMI设计正在前所未有的新高度,本篇文章就来聊聊HMI设计的那些事 ⬇⬇⬇点击获取更多设计资源 https://js.design/community?category=designsource=csdnplan=bbqcsdn777   HMI的是

    2024年02月16日
    浏览(40)
  • 深入解析MySQL视图、索引、数据导入导出:优化查询和提高效率

    目录 1. 视图(View): 什么是视图? 为什么要使用视图? 视图的优缺点 1) 定制用户数据,聚焦特定的数据 2) 简化数据操作 3) 提高数据的安全性 4) 共享所需数据 5) 更改数据格式 6) 重用 SQL 语句 示例操作 没使用前 使用后 2. 索引(Index): 什么是索引? 为什么要使用索引?

    2024年02月13日
    浏览(61)
  • 汽车销售数据可视化分析实战

    市场需求:各年度汽车总销量及环比,各车类、级别车辆销量及环比 消费能力/价位认知:车辆销售规模及环比、不同价位车销量及环比 企业/品牌竞争:各车系、厂商、品牌车销量及环比,市占率及变化趋势 热销车型:品牌、车类、车型、级别的各top销量 1、数据的读取 2、

    2024年02月16日
    浏览(47)
  • 机器学习预测汽车油耗效率 MPG

    数据获取 导入需要的包 引入文件,查看内容 划分训练集和测试集 调用模型 查看准确率 这里先用重量做特征 线性回归 文字 可视化查看 准确率只有0.69因为只用到了weight 选三个变量建模 预测准确率

    2024年04月23日
    浏览(15)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包