数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)

这篇具有很好参考价值的文章主要介绍了数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1.读取本的数据集

# 读取本地的数据集
# 数据集可以私信我我发给你们,同样也可以
df = pd.read_excel('data1.xlsx')  
df

数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)

2.查看数据的前5行

使用head()函数查看数据的前几行,可以传入具体的数,默认是5

# 查看数据的前5行
df.head()

数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)

3.将salary列的数据转换为最大值和最小值的平均值

map和apply函数接受的参数都是一个行数,而且都不会直接改变原数据,都是返回一个新的DataFrame对象

# 将salary列数据转换为最大值和最小值的平均值
# 方式一 使用map函数
def fun(x):
    a,b = x.split('-')
    a = int(a.strip('k'))*1000
    b = int(b.strip('k'))*1000
    return int((a+b)/2)
df['salary'].map(fun)

# 方式二使用apply函数
df['salary'] = df['salary'].apply(fun)
df

4.将数据根据学历进行分组计算平均值

使用groupby()函数进行分组

# 将数据根据学历进行分组并计算平均值
df.groupby('education').mean()

数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)

5.将createTime列转换为月日

# 将create Time列转换为月日

for i in range(len(df)):
    df.iloc[i,0] = df.iloc[i,0].to_pydatetime().strftime('%m-%d')

df.head()

数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)

6.查看所索引,数据类型和内存信息

info()函数

# 查看索引,数据类型,和内存信息
df.info()

数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)

7.查看数值型列的汇总统计

describe() 返回的数据包括,数量,数据的平均值,标准差,最小值,最大值,25%、50% 75 % 的分位数

# 查看数值型列的汇总统计
df.describe()

数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)

8.新增一列根据salary将数据分为三组

# 新增一列根据salary将数据分为三组,并且设置等级
bins = [0,5000,20000,50000]
group_names = ['底','中','高']

df['categories'] = pd.cut(df['salary'],bins,labels=group_names)
df

数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)

9.按照salary列队数据降序排序

sort_values 默认是升序

# 按照salary列对数据降序排列
# ascending=False降序
# ascending=True升序

df.sort_values('salary',ascending=False)

数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)

10.取出第33行的数据

根据索引选出第33行,索引从0开始

# 取出第33行的数据
df.loc[32]

数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)

今天的10道题涉及的东西多了一些,groupbydescribecutsort_valuesinfo等,如果想要全部的了解这些,仅靠这10道题是远远不够的,希望大家能够额外找些试题练习,也可以根据跟着博主的文章一块刷题✨✨✨

推荐使用牛客网进行练习 直达牛客,快人一步

数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)

欢迎您的关注
数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)文章来源地址https://www.toymoban.com/news/detail-417601.html

到了这里,关于数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(5)

    本章的10道题仍然是基于前章的文件,主要学习了有设置索引、合并两个DataFrame对象、更改数据类型,不同列之间的运算,统计一列不同值得个数以及不同值分别出现得次数,还有如何灵活的运用布尔值运算。 数据集没有的可以私信我,也可以直接去我的资源里面找 set_inde

    2023年04月09日
    浏览(37)
  • 数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(4)

    本章的十道题与前面的试题相连接,数据集用的同一个数据集一些操作也是基于上一个练习的 本次导包多导入了一个绘图的包,在这里我们只是简单的应用,后面会有详细的讲解用法 数据集没有的可以私信我,也可以直接去我的资源里面找 中位数(Median)又称中值,统计学

    2024年02月05日
    浏览(40)
  • 国际旅游网络的大数据分析(数学建模练习题)

    伴随着大数据时代的到来,数据分析已经深入到现代社会生活中的各个方面。 无论是国家政府部门、企事业单位还是个人,数据分析工作都是进行决策之前的 重要环节。 山东省应用统计学会是在省民政厅注册的学术类社会组织,于 1989 年成立。 学会是全省目前从事统计调查

    2024年02月11日
    浏览(51)
  • Pandas十大练习题,掌握常用方法

    代码均在Jupter Notebook上完成 数据集可从此获取: 链接: https://pan.baidu.com/s/1YGwh3pqxW4OlrQXt-5wgFg?pwd=3znx 提取码: 3znx 简介 数据集 1.分析Chipotle快餐数据 chipotle.tsv 2.分析2012欧洲杯数据 Euro2012_stats.csv 3.分析酒类消费数据 drinks.csv 4.分析1960 - 2014 美国犯罪数据 US_Crime_Rates_1960_2014.csv 5.分

    2024年01月16日
    浏览(51)
  • 【Python练习】数据分析库Pandas

    1. 了解Serie

    2024年02月09日
    浏览(57)
  • 日志审计与分析练习题

    1.  ( 单选题) 【单选题】以下关于日志的描述不正确的是( ) A. 日志是在事故发生后查明“发生了什么”的一个很好的“取证”信息来源,但无法为审计进行跟踪 B. 日志是由各种不同的实体产生的“安全记录”的集合 C. 通常为计算机系统、设备、软件等在某种情况下记录的信息

    2024年02月08日
    浏览(51)
  • 【算法设计与分析】动态规划-练习题

    输入一个整数数组 S[n] ,计算其最长递增子序列的长度,及其最长递增子序列。 定义 k ( 1 ≤ k ≤ n ) k (1 ≤ k ≤ n) k ( 1 ≤ k ≤ n ) ,L[k]表示以 S[k] 结尾的递增子序列的最大长度。子问题即为 L[k]。 对于每一个k,我们都遍历前面0~k-1的所有的数,找出最大的L[i],且 S [ k ] L [

    2024年02月03日
    浏览(57)
  • C语言:指针【进阶】习题练习及分析讲解

    前言: 前面我们刚刚学完了C语言:指针详解【进阶】的知识,这部分的知识还是要重在理解加实践,今天我这里就分享一些有关C语言指针方面的练习供大家更深入的理解指针的知识。 我们初期的指针学习大部分都是与数组的知识绑定在一起的,所以今天的练习也是大多与数

    2024年02月02日
    浏览(45)
  • 数据结构——二叉树练习题

    目录 单值二叉树  相同的树  另一棵树的子树 二叉树的前序遍历  二叉树的构造及遍历 给大家推荐一款刷题,找工作的好网站——牛客网 牛客网 - 找工作神器|笔试题库|面试经验|实习招聘内推,求职就业一站解决_牛客网   思路:根节点跟左子树比较,若相等则继续比,一

    2024年02月11日
    浏览(39)
  • 【数据结构】“单链表”的练习题

    💐 🌸 🌷 🍀 🌹 🌻 🌺 🍁 🍃 🍂 🌿 🍄🍝 🍛 🍤 📃 个人主页 :阿然成长日记 👈点击可跳转 📆 个人专栏: 🔹数据结构与算法🔹C语言进阶 🚩 不能则学,不知则问,耻于问人,决无长进 🍭 🍯 🍎 🍏 🍊 🍋 🍒 🍇 🍉 🍓 🍑 🍈 🍌 🍐 🍍 题目要求: 给你单链

    2024年02月14日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包