Pandas 常见用法演示及解释

这篇具有很好参考价值的文章主要介绍了Pandas 常见用法演示及解释。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1. 创建 DataFrame

DataFrame 是 Pandas 中的一个基本数据结构,用于以表格形式存储和操作数据。以下是创建 DataFrame 的代码示例:

import pandas as pd

# 创建一个简单的 DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'City': ['New York', 'Paris', 'London']}
df = pd.DataFrame(data)

这里,我们创建了一个包含姓名、年龄和城市的 DataFrame。每个键('Name', 'Age', 'City')对应一列,而键的值是一个列表,表示列中的数据。

2. 数据选择和过滤

Pandas 提供了灵活的数据选择和过滤选项。例如,您可以选择特定的列或基于条件过滤数据。这在数据分析中非常有用:

# 选择特定的列
selected_columns = df[['Name', 'City']]

# 过滤特定的行(例如,选择年龄大于 30 的行)
filtered_rows = df[df['Age'] > 30]
3. 数据清洗:处理 NaN 值

在真实世界的数据集中,经常会遇到缺失值(NaN)。Pandas 提供了处理这些缺失值的方法,例如,您可以用一个特定的值填充它们:

import numpy as np

# 人为添加 NaN 值
df_with_nan = df.copy()
df_with_nan.loc[1, 'Age'] = np.nan

# 填充 NaN 值
df_filled = df_with_nan.fillna({'Age': df_with_nan['Age'].mean()})

在这个例子中,df_with_nan.loc[1, 'Age'] = np.nan 将第二行的 'Age' 列设置为 NaN,代表缺失值。然后,我们用平均年龄填充了所有的 NaN 值。

4. 数据聚合和分组

Pandas 允许您对数据集进行分组,并对每组数据进行聚合计算,如计算平均值、求和等:

# 添加一个分组列
df['Group'] = ['A', 'B', 'A']

# 按 'Group' 分组并计算每组的平均年龄
grouped_data = df.groupby('Group')['Age'].mean()

这里,df.groupby('Group')['Age'].mean() 将 DataFrame 按 'Group' 列的值分组,并计算每个组中 'Age' 列的平均值。

5. 描述性统计

描述性统计是数据分析的一个重要方面。Pandas 提供了 describe 方法,用于快速查看数据的统计摘要:

# 获取描述性统计信息
description = df.describe()

df.describe() 提供了每个数值列的计数、平均值、标准差、最小值、四分位数和最大值。

6. 读取和写入 CSV 文件

Pandas 支持多种格式的数据读写,例如 CSV:

# 写入 CSV 文件
df.to_csv('my_data.csv', index=False)

# 从 CSV 文件读取数据
df_from_csv = pd.read_csv('my_data.csv')

在这里,df.to_csv('my_data.csv', index=False) 将 DataFrame 写入 my_data.csv 文件。然后,我们使用 pd.read_csv('my_data.csv') 从该文件中读取数据。

总结

Pandas 是 Python 数据分析的强大工具,提供了丰富的功能来处理和分析数据。从创建和修改 DataFrame 到执行复杂的数据过滤、聚合和统计分析,Pandas 使得数据分析变得更加容易和直观。无论是处理小型数据集还是大型复杂的数据集,Pandas 都是数据科学家和分析师的重要工具。文章来源地址https://www.toymoban.com/news/detail-812496.html

到了这里,关于Pandas 常见用法演示及解释的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【python】Pandas库用法详解!

    pandas 是基于NumPy 的一种工具,该工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分

    2024年02月04日
    浏览(37)
  • python-pandas用法大全

    问题描述:想要把 DataFrame 最后一列 label 的数据格式从 float 改成 int 原来: 代码: out: 读取时要注意的参数有 sep 等等。 在表头顺序一样的情况下,可以这样无脑连接两个 DataFrame : 有关 np.concat 的可以看:https://www.jb51.net/article/164905.htm 本文主要讲 np.merge() 。 但是如果两个

    2024年02月05日
    浏览(36)
  • 【Python】进阶学习:pandas--rename()用法详解

    【Python】进阶学习:pandas-- rename()用法详解 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程👈 希望得到您的订阅和支持~ 💡 创作高质量博文(平均质量分92+),分享更多关于深度学习、PyTorch、

    2024年04月11日
    浏览(50)
  • 【Python】进阶学习:pandas--info()用法详解

    【Python】进阶学习:pandas–info()用法详解 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程👈 希望得到您的订阅和支持~ 💡 创作高质量博文(平均质量分92+),分享更多关于深度学习、PyTorch、P

    2024年03月10日
    浏览(73)
  • pandas之apply函数简介及用法详解

    ​ Pandas 的 apply() 方法是用来调用一个函数(Python method),让此函数对数据对象进行批量处理。Pandas 的很多对象都可以使用 apply() 来调用函数,如 Dataframe、Series、分组对象、各种时间序列等。 ​ apply() 使用时,通常放入一个 lambda 函数表达式、或一个函数作为操作运算,官方上

    2024年02月03日
    浏览(43)
  • Python-pandas:数据合并merge函数用法详解

    介绍一下数据分析中很常用的一个函数——merge,它能够进行高效的数据合并操作。先看一下语法格式及其初步解释: 生成的两个DataFrame对象如下: 1、参数left,right: 将df_d作为左侧的frame,df_e作为右侧的frame,则参数left=df_d,right=df_e; 2、参数how: 当参数how=\\\'left\\\':仅使用左

    2024年02月15日
    浏览(47)
  • NumPy和Pandas库的基本用法,用于数据处理和分析

    当涉及到数据处理和分析时,NumPy和Pandas是两个非常常用的Python库。下面是它们的基本用法: NumPy(Numerical Python): 导入NumPy库:在代码中使用import numpy as np导入NumPy库。 创建NumPy数组:使用np.array()函数可以创建一个NumPy数组。例如,arr = np.array([1, 2, 3, 4, 5])创建一个包含整数

    2024年02月11日
    浏览(42)
  • Python中Pandas库提供的函数——pd.DataFrame的基本用法

    pd.DataFrame 是 Pandas 库中的一个类,用于创建和操作数据框(DataFrame)。DataFrame 是 Pandas 的核心数据结构,用于以表格形式和处理数据,类似提供电子表格或数据库表格。类了创建 pd.DataFrame 数据框、访问数据、进行数据操作和分析的方法和属性。 表格形式 :DataFrame是一个二维

    2024年02月05日
    浏览(54)
  • Python AI库 Pandas的常见操作的扩展知识

    Python AI库 Pandas的常见操作的扩展知识 本文默认读者具备以下技能: 熟悉python基础知识,vscode或其它编辑工具 熟悉表格文件的基本操作 具备自主扩展学习能力 前文中对Pandas的数据结构以及基础操作做了介绍,本文中会在前文的基础上,对常见的操作进行拓展,并举例说明。 一、

    2024年04月29日
    浏览(36)
  • Pandas数据库查询更新create_engine用法,以及一些警告及弃用处理

    警示情况: 目前使用的连接方式: 避免警告提示推荐使用SQLAlchemy 需要先安装SQLAlchemy库: pip install sqlalchemy 新连接使用方式: sql语句需要使用text()包裹使用,如果没有包裹则会报错: engine需要使用connect()否则会出现如下报错: 原因:pd.read_sql方法传递“连接”变量而

    2024年02月10日
    浏览(36)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包