Pandas对日期数据的处理

这篇具有很好参考价值的文章主要介绍了Pandas对日期数据的处理。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Pandas对日期数据的处理


前言

Pandas中提供了许多简单易用的日期数据处理函数,包括将字符串转换成为对应的日期数据,根据日期来选取数据等等。接下来,让我们了解一下Pandas中对日期数据的处理。


一、将字符串转换为日期类型

1、将字符串形式的日期数据转换成为日期类型,方便后续处理

代码如下:

# 将各种日期字符串转换成日期格式
import pandas as pd
data = ['12Feb23', '20201225', '2022/12/25', '2018.7.12']
columns = ['日期']
df = pd.DataFrame(data = data, columns = columns)
df['转换后'] = pd.to_datetime(df['日期'])
df

运行结果:
Pandas对日期数据的处理

2、根据多列中的数据,组成一列为日期类型

代码如下:

# 从多列中组合成一个日期
df = pd.DataFrame({
    'year' : [2018, 2019, 2020],
    'month' : [2, 3, 4],
    'day' : [22, 12, 30],
    'hour' : [12, 14, 15],
    'minute' : [19, 30, 45],
    'second' : [12, 23, 45]
})
df['组合后的日期'] = pd.to_datetime(df)
df

运行结果:
Pandas对日期数据的处理

二、dt对象的使用

pandas可以使用dt对象获取datetime数据类型的特定信息

代码如下:

# dt 对象的使用
import pandas as pd
df = pd.read_excel('datetime.xlsx')
df['日期'] = pd.to_datetime(df['原日期'])
df['年'] = df['日期'].dt.year
df['月'] = df['日期'].dt.month
df['日'] = df['日期'].dt.day
df['星期几'] = df['日期'].dt.day_name()
df['是否年底'] = df['日期'].dt.is_year_end
df

运行结果:
Pandas对日期数据的处理


三、根据日期获取数据

代码如下:

# 获取日期区间的数据
import pandas as pd
df = pd.read_excel('销售数据.xlsx')
df.sort_values(by = '日期', inplace = True)
df = df.set_index('日期')
# df
# df['2021']
# df['2021-01']
df['2021-01-23':'2021-01-23'] #查看某一日数据
# df['2021-01-23':'2021-02-23']

四、根据日期统计数据

代码如下:

# 按照不同时期统计数据
import pandas as pd
df = pd.read_excel('销售数据.xlsx')
df = df.set_index('日期')
# 按年统计求和
df1 = df.resample('AS').sum()
df1
# 按季度统计求和
df2 = df.resample('Q').sum()
df2
# 按月度统计求和
df3 = df.resample('M').sum()
df3
# 按周统计求和
df4 = df.resample('W').sum()
df4
# 按天统计求和
df5 = df.resample('D').sum()
df5

运行结果(按照年统计求和)
Pandas对日期数据的处理


五、根据日期显示数据

代码如下:

# 按照不同时期显示数据
import pandas as pd
df = pd.read_excel('销售数据.xlsx')
df = df.set_index('日期')
df = df.sort_values('日期')
df

df1 = df.to_period('A')
df1

df2 = df.to_period('Q')
df2

df3 = df.to_period('M')
df3

df4 = df.to_period('W')
df4

df5 = df.to_period('D')
df5

运行结果:

Pandas对日期数据的处理


六、根据日期统计并显示数据

代码如下:

# 按时期统计并显示数据
import pandas as pd
df = pd.read_excel('销售数据.xlsx')
df = df.set_index('日期')
df = df.sort_values('日期')
df

# 按照季度统计数据
df1 = df.resample('Q').sum()
print(df1)

# 按照季度统计数据并显示
df2 = df.resample('Q').sum().to_period('Q')
df2

运行结果:

Pandas对日期数据的处理


总结

以上就是今天要讲的内容,本文仅仅简单介绍了pandas中对日期类型的处理,和根据日期类型对数据进行统计显示文章来源地址https://www.toymoban.com/news/detail-455828.html

到了这里,关于Pandas对日期数据的处理的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • pandas处理双周数据

    处理文件题头格式 导入源 合并两列数据

    2024年02月04日
    浏览(29)
  • 【机器学习5】数据处理(二)Pandas:表格处理

    Pandas提供了三种数据类型,分别是 Series 、 DataFrame 和 Panel 。Series用于保存一维数据,DataFrame用于保存二维数据,Panel用于保存三维数据或者可变维数据。平时的表格处理数据分析最常用的数据类型是 Series 和 DataFrame ,Panel较少用到。 Series本质上是一个含有索引的 一维数组

    2024年02月13日
    浏览(31)
  • Pandas入门实践2 -数据处理

    为了准备数据进行分析,我们需要执行数据处理。在本节中,我们将学习如何清理和重新格式化数据(例如,重命名列和修复数据类型不匹配)、对其进行重构/整形,以及对其进行丰富(例如,离散化列、计算聚合和组合数据源)。 数据清洗 在本节中,我们将介绍如何创建

    2023年04月22日
    浏览(54)
  • 【Python数据处理】-Pandas笔记

    Pandas是一个强大的Python数据处理库,它提供了高效的数据结构和数据分析工具,使数据处理变得简单而快速。本篇笔记将介绍Pandas中最常用的数据结构——Series和DataFrame,以及数据处理的各种操作和技巧。 (一)创建Series Series是Pandas中的一维数组,类似于带有标签的NumPy数组

    2024年02月12日
    浏览(37)
  • Pandas的时间与日期(日期转换,创建日期等)

    创建日期: 事实证明,熊猫作为处理时间序列数据的工具非常成功,特别是在财务数据分析领域。使用NumPy datetime64和timedelta64dtypes,我们整合了其他Python库中的大量功能,scikits.timeseries并创建了大量用于处理时间序列数据的新功能。 在处理时间序列数据时,我们会经常寻求

    2024年02月04日
    浏览(37)
  • Python Pandas 处理Excel数据 制图

    目录 1、饼状图  2、条形统计图

    2024年02月11日
    浏览(29)
  • 头歌Python实训——pandas数据处理

    任务描述 本关任务: 超市销售数据如图所示 建立excel文件“类别销售”,根据不同类别建立多个工作表,将相同类别的销售信息存放在相应的工作表中。 相关知识 为了完成本关任务,你需要掌握:1.读取excel文件,2.筛选dataframe数据,3.将数据写入工作簿和工作表 从excel文件读

    2024年02月04日
    浏览(29)
  • pandas由入门到精通-数据处理

    文中用S代指Series,用Df代指DataFrame 数据清洗是处理大型复杂情况数据必不可少的步骤,这里总结一些数据清洗的常用方法:包括缺失值、重复值、异常值处理,数据类型统计,分箱,随机采样,向量化编码等方法。每种方法都给出了代码和实例,并用表格进行总结。 判断D

    2024年02月11日
    浏览(36)
  • 数据分析-Pandas如何轻松处理时间序列数据

    时间序列数据在数据分析建模中很常见,例如天气预报,空气状态监测,股票交易等金融场景。此处选择巴黎、伦敦欧洲城市空气质量监测 N O 2 NO_2 N O 2 ​ 数据作为样例。 python数据分析-数据表读写到pandas 经典算法-遗传算法的python实现 经典算法-遗传算法的一个简单例子 大

    2024年01月25日
    浏览(36)
  • 第五章Pandas数据载入与预处理

    1:利用下面哪个可视化绘图可以发现数据的异常点 A.密度图 B.直方图 C.盒图 D.概率图 知识点解析: 密度图:表现与数据值对应的边界或域对象的一种理论图形表示方法 直方图:直方图是数值数据分布的精确图形表示 盒图:是结构化编程中的一种可视化建模 概率图:用图来

    2024年02月05日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包