Python机器学习实验 Python 数据分析

这篇具有很好参考价值的文章主要介绍了Python机器学习实验 Python 数据分析。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1.实验目的

掌握常见数据预处理方法,熟练运用数据分析方法,并掌握 Python 中的 Numpy、 Pandas 模块提供的数据分析方法。

2.实验内容

1. Pandas 基本数据处理

使用 Pandas 模块,完成以下操作。

(1)创建一个由 0 到 50 之间的整数组成的 10 行 5 列的 dataframe。如下:

python基础知识实验分析,python,机器学习,开发语言

(2)汇总每一列的最小值。

python基础知识实验分析,python,机器学习,开发语言

(3)按行方向汇总每行数据的总和。

python基础知识实验分析,python,机器学习,开发语言

(4)按列方向汇总每列数据的总和。

python基础知识实验分析,python,机器学习,开发语言

代码:

#创建一个由 0 到 50 之间的整数组成的 10 行 5 列的 dataframe
import pandas as pd
import numpy as np
df = pd.DataFrame(np.arange(0, 50).reshape(10, 5))
# 输出 dataframe
print('dataframe:',df)
# 汇总每一列的最小值
min_values = np.min(df, axis=0)
print("每列的最小值:", min_values)
# 按行方向汇总每行数据的总和
row_sums = np.sum(df, axis=1)
print("每行的总和:", row_sums)
# 按列方向汇总每列数据的总和
col_sums = np.sum(df, axis=0)
print("每列的总和:", col_sums)
python基础知识实验分析,python,机器学习,开发语言 python基础知识实验分析,python,机器学习,开发语言

2.  城市夏季气温分析 在“tpData.csv”文件中存储的是韩国某城市夏季的最高、最低气温数据,时间是

从 2013 年到 2018 年间,日期是从每年的 6 月 30 日到 8 月 30 日。其中 Present_Tmax

字段代表下午 2 点测量的最高温度。Present_Tmin 代表凌晨 4 点测量的最低温度。完 成以下操作。

(1)使用 Pandas 的 read_csv()函数读取“tpData.csv”,并显示数据。 import pandas as pd

df = pd.read_csv('tpData.csv')

#header:Year Month Day Present_Tmax Present_Tmin df

python基础知识实验分析,python,机器学习,开发语言

图 4-1   韩国某城市夏季温度数据

(2)按年度分组,查看每年各有多少条数据。 操作提示:

使用 groupby 函数,按 Year 字段分组。

#分组统计

df.groupby('Year').size() #查看组大小结果

python基础知识实验分析,python,机器学习,开发语言

(3)按年份统计每年的最高温度的平均值。 操作提示:

使用 groupby 函数,按 Year 字段分组,统计 Present_Tmax 字段的平均值。

df.groupby('Year')['Present_Tmax'].mean()

python基础知识实验分析,python,机器学习,开发语言

(4)按月份统计 6、7、8 每个月的最高温度的平均值。

df.groupby('Month')['Present_Tmax'].mean()

python基础知识实验分析,python,机器学习,开发语言

(5)按月份统计 6、7、8 每个月的最低温度的平均值。

df.groupby('Month')['Present_Tmin'].mean()

python基础知识实验分析,python,机器学习,开发语言

代码:

#使用 Pandas 的 read_csv()函数读取“tpData.csv”,并显示数据
import pandas as pd
df = pd.read_csv(r'D:\tpData.csv')
print(df)
#按年度分组,查看每年各有多少条数据。 操作提
print(df.groupby('Year').size())
#按年份统计每年的最高温度的平均值。 操作提示
print(df.groupby('Year')['Present_Tmax'].mean())
#按月份统计 6、7、8 每个月的最高温度的平均值。
print(df.groupby('Month')['Present_Tmax'].mean())
#按月份统计 6、7、8 每个月的最低温度的平均值。
print(df.groupby('Month')['Present_Tmin'].mean()

python基础知识实验分析,python,机器学习,开发语言

python基础知识实验分析,python,机器学习,开发语言文章来源地址https://www.toymoban.com/news/detail-845848.html

到了这里,关于Python机器学习实验 Python 数据分析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • python数据分析之利用多种机器学习方法实现文本分类、情感预测

           大家好,我是带我去滑雪!        文本分类是一种机器学习和自然语言处理(NLP)任务,旨在将给定的文本数据分配到预定义的类别或标签中。其目标是为文本数据提供自动分类和标注,使得可以根据其内容或主题进行组织、排序和分析。文本分类在各种应用场景

    2024年02月11日
    浏览(32)
  • 数据分析毕业设计 大数据糖尿病预测与可视化 - 机器学习 python

    # 1 前言 🚩 基于机器学习与大数据的糖尿病预测 🥇学长这里给一个题目综合评分(每项满分5分) 难度系数:3分 工作量:3分 创新点:4分 选题指导,项目分享: https://gitee.com/yaa-dc/warehouse-1/blob/master/python/README.md 本项目的目的主要是对糖尿病进行预测。主要依托某医院体检数

    2024年02月08日
    浏览(50)
  • python机器学习数据建模与分析——决策树详解及可视化案例

    你是否玩过二十个问题的游戏,游戏的规则很简单:参与游戏的一方在脑海里想某个事物,其他参与者向他提问题,只允许提20个问题,问题的答案也只能用对或错回答。问问题的人通过推断分解,逐步缩小待猜测事物的范围。决策树的工作原理与20个问题类似,用户输人一系

    2024年02月03日
    浏览(43)
  • GPT4+Python近红外光谱数据分析及机器学习与深度学习建模

    详情点击链接:GPT4+Python近红外光谱数据分析及机器学习与深度学习建模 第一:GPT4 1、ChatGPT(GPT-1、GPT-2、GPT-3、GPT-3.5、GPT-4模型的演变) 2、ChatGPT对话初体验 3、GPT-4与GPT-3.5的区别,以及与国内大语言模型(文心一言、星火等)的区别 4、ChatGPT科研必备插件(Data Interpreter、

    2024年01月25日
    浏览(49)
  • ChatGPT4+Python近红外光谱数据分析及机器学习与深度学习建模

      2022年11月30日,可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出了聊天机器人ChatGPT3.5,将人工智能的发展推向了一个新的高度。2023年4月,更强版本的ChatGPT4.0上线,文本、语音、图像等多模态交互方式使其在各行各业的应用呈现了更多的可能性。

    2024年01月23日
    浏览(48)
  • 基于ChatGPT4+Python近红外光谱数据分析及机器学习与深度学习建模

    022年11月30日,可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出了聊天机器人ChatGPT3.5,将人工智能的发展推向了一个新的高度。2023年4月,更强版本的ChatGPT4.0上线,文本、语音、图像等多模态交互方式使其在各行各业的应用呈现了更多的可能性。2023年

    2024年01月25日
    浏览(51)
  • 基于python机器学习XGBoost算法农业数据可视化分析预测系统

    基于python机器学习XGBoost算法农业数据可视化分析预测系统,旨在帮助农民和相关从业者更好地预测农作物产量,以优化农业生产。该系统主要包括四个功能模块。 首先,农作物数据可视化模块利用Echarts、Ajax、Flask、PyMysql技术实现了可视化展示农作物产量相关数据的功能。

    2024年01月21日
    浏览(59)
  • 大数据分析的Python实战指南:数据处理、可视化与机器学习【上进小菜猪大数据】

    上进小菜猪,沈工大软件工程专业,爱好敲代码,持续输出干货。 引言: 大数据分析是当今互联网时代的核心技术之一。通过有效地处理和分析大量的数据,企业可以从中获得有价值的洞察,以做出更明智的决策。本文将介绍使用Python进行大数据分析的实战技术,包括数据

    2024年02月08日
    浏览(63)
  • 基于ChatGPT4+Python近红外光谱数据分析及机器学习与深度学习建模教程

    详情点击链接:基于ChatGPT4+Python近红外光谱数据分析及机器学习与深度学习建模教程 第一:GPT4 1、ChatGPT(GPT-1、GPT-2、GPT-3、GPT-3.5、GPT-4模型的演变) 2、ChatGPT对话初体验 3、GPT-4与GPT-3.5的区别,以及与国内大语言模型(文心一言、星火等)的区别 4、ChatGPT科研必备插件(Da

    2024年01月23日
    浏览(47)
  • ChatGPT4+Python近红外光谱数据分析及机器学习与深度学习建模进阶应用

    2022年11月30日,可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出了聊天机器人ChatGPT3.5,将人工智能的发展推向了一个新的高度。2023年4月,更强版本的ChatGPT4.0上线,文本、语音、图像等多模态交互方式使其在各行各业的应用呈现了更多的可能性。202

    2024年02月02日
    浏览(45)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包