Pandas:查询指定数据、数据的详细信息

这篇具有很好参考价值的文章主要介绍了Pandas:查询指定数据、数据的详细信息。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、前言

本文主要介绍了在Python中,如何利用Pandas去读取数据、查询指定条件的数据、以及数据的详细信息.

二、数据集

网上随便找的数据集

三、数据查看常用方法

1、读取数据
import pandas as pd
#读取excel文件
data=pd.read_excel('C:/Users/abc/Desktop/users_info.xlsx')

Pandas:查询指定数据、数据的详细信息

2、查看数据的大小

数据量(行)、数据指标(列)、数据维度、尺寸

#查看数据尺寸
print(data.shape)
#查看数据数量
print(data.size)

Pandas:查询指定数据、数据的详细信息

3、获取前/后N条数据
  • 获取前4条数据:
  • head()方法
print(data.head(4))

Pandas:查询指定数据、数据的详细信息

  • 默认获取前5条数据:
print(data.head())

Pandas:查询指定数据、数据的详细信息

  • 获取后N条数据: 使用tail()函数
  • 默认显示后5条
print(data.tail(4))

Pandas:查询指定数据、数据的详细信息

4、完整展示每个字段的数据

如下图:有些字段的数据被折叠起来,用省略号表示
Pandas:查询指定数据、数据的详细信息

  • 可以通过设置界面显示的最大列数据量来解决
  • 参数:max_columns
  • 若设置的数大于数据表的列数,则可以完整地展示所有列的内容
  • 比如数据表共有37列数据,我们不妨把数字设置为40
#设置界面显示的最大行列数据量
#若设置的数大于数据表的列数,则可以完整地展示所有列的内容
pd.options.display.max_columns= 40
data.head()

Pandas:查询指定数据、数据的详细信息
结果:
可以看到之前被折叠的数据已经全部展示出来了
Pandas:查询指定数据、数据的详细信息

  • 若不知道数据有多少列,参数max_columns的值可以设为None,也可以完整展示所有字段的数据
#设置界面显示的最大列数据量
#若设置的数大于数据表的列数,则可以完整地展示所有列的内容
pd.options.display.max_columns= None
data.head()

Pandas:查询指定数据、数据的详细信息

5、行的数据被折叠

如图:数据表的行数较多时,直接展示的话,部分数据会被折叠起来,用省略号表示
Pandas:查询指定数据、数据的详细信息

  • 设置最大行参数max_rows的值即可解决
  • pd.options.display.max_rows= None :即展示所有行的数据
  • 若数据量较大,数据全部展示的话,比较耗时间,此时可以选择head()方法来显示前N条数据
#设置界面显示的最大行数据量
#若设置的数大于数据表的列数,则可以完整地展示所有列的内容
pd.options.display.max_rows= None
data

Pandas:查询指定数据、数据的详细信息

四、查看指定条件的数据

1、查询指定字段内容的数据

如图:字段名为"ORGANIZE_NAME",字段值为“统计班”的数据共有27条,37是指数据表共有37个字段

#查看指定条件的数据表
data[data['ORGANIZE_NAME']=='统计班'].shape

Pandas:查询指定数据、数据的详细信息

2、查询条件的叠加

如图:字段名为"ORGANIZE_NAME",字段值为“统计班”,并且字段”address“为广州的数据共有22条

#叠加条件
data[data['ORGANIZE_NAME']=='统计班'][data['address']=='广州'].shape

Pandas:查询指定数据、数据的详细信息

3、查看指定行/列的数据
(1)查看指定列
  • 查看字段名为 "ORGANIZE_NAME"的前5个内容:
#查看指定列
data["ORGANIZE_NAME"].head()

Pandas:查询指定数据、数据的详细信息

  • 查看字段名为"ORGANIZE_NAME" 和 字段名为“address” 的前5个内容:
#查看多列数据
data[["ORGANIZE_NAME","address"]].head()

Pandas:查询指定数据、数据的详细信息

(2)查看指定行

【20:30】: 查询的数据范围包含左区间,不包含右区间

#查看指定行
data[20:25]

Pandas:查询指定数据、数据的详细信息

(3)查看指定的行和列
  • 使用loc方法
  • loc[20,“ORGANIZE_NAME”]:
    即查看第20行,字段名为“ORGANIZE_NAME ” 的数据
#查看指定的行和列
data.loc[20,"ORGANIZE_NAME"]

Pandas:查询指定数据、数据的详细信息

  • 查看字段名为“ORGANIZE_NAME ” 第20到30行的数据
#查看指定的行和列
data.loc[20:30,"ORGANIZE_NAME"]

Pandas:查询指定数据、数据的详细信息

  • 查看多行多列数据:
#查看指定的行和列
data.loc[20:30,["ORGANIZE_NAME","ACCOUNT"]]

Pandas:查询指定数据、数据的详细信息

  • iloc方法:
    • 该方法可以对列进行索引查询,而loc方法不可以对列进行索引查询
    • 查看前5列的第20-30行的数据
#查看指定行和列
data.iloc[20:31,:5]

Pandas:查询指定数据、数据的详细信息

  • iat方法:查看指定行和列的数据:
    查询第10行第1列的数据:
#查看指定行和列
data.iat[10,0]

Pandas:查询指定数据、数据的详细信息

等价于:

#查看指定行和列
data.loc[10,"USER_ID"]

Pandas:查询指定数据、数据的详细信息

五、查看数据的详细信息

1、查看数据的详细信息、数据指标的类型
#查看数据的详细信息和数据指标的类型
data.dtypes

Pandas:查询指定数据、数据的详细信息

2、统计不同类型数据指标的数量

比如下图:数据类型为 int64 的有2个字段

#统计不同类型数据指标的数量
from collections import Counter
Counter(data.dtypes.values)

Pandas:查询指定数据、数据的详细信息

3、查看数据的详细信息

包括:指标类型统计、数据大小、内存占用信息

#查看数据的详细信息、指标类型统计、数据大小、内存占用信息
data.info()

Pandas:查询指定数据、数据的详细信息
Pandas:查询指定数据、数据的详细信息文章来源地址https://www.toymoban.com/news/detail-433410.html

到了这里,关于Pandas:查询指定数据、数据的详细信息的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Pandas数据库查询更新create_engine用法,以及一些警告及弃用处理

    警示情况: 目前使用的连接方式: 避免警告提示推荐使用SQLAlchemy 需要先安装SQLAlchemy库: pip install sqlalchemy 新连接使用方式: sql语句需要使用text()包裹使用,如果没有包裹则会报错: engine需要使用connect()否则会出现如下报错: 原因:pd.read_sql方法传递“连接”变量而

    2024年02月10日
    浏览(36)
  • 车辆信息快速查找API:轻松查询车牌号对应车辆的详细资料

      车辆信息的快速查找对于许多人来说是非常有用的。无论是想要购买一辆二手车,还是需要了解某辆车的详细信息,这个需求在现实生活中经常会遇到。那么,有没有一种快速方便的方法来实现这个功能呢?答案是有的,就是通过车辆信息快速查找API。 在这篇博文中,我们

    2024年03月24日
    浏览(48)
  • Java查询es数据,根据指定id检索(in查询),sql权限过滤,多字段匹配检索,数据排序

    Java集成Elasticsearch,进行索引数据查询,并进行sql权限过滤,指定id检索(in查询),多字段匹配检索,数据排序。由于权限过滤是根据sql语句判断当前用户或其部门可查询的数据,所以采用以下方法: 1.通过sql过滤出当前用户可查询的数据id集合idsList; 2.将当前用户可查询的

    2024年02月22日
    浏览(65)
  • PostgreSQL详细教程(一)—— 前言

    目录 PostgreSQL简介 PostgreSQL 特征   PostgreSQL 是一个免费的对象-关系数据库服务器(ORDBMS),在灵活的BSD许可证下发行。 PostgreSQL 开发者把它念作 post-gress-Q-L。 PostgreSQL 的 Slogan 是 \\\"世界上最先进的开源关系型数据库\\\"。 PostgreSQL与Oracle一样是使用共享内存的进程结构,而大家都比较

    2024年02月12日
    浏览(45)
  • PostgreSQL 查询数据表、视图信息

    --查询指定数据基表的列信息

    2024年02月12日
    浏览(58)
  • mssql数据库基本信息查询

    –查询数据库 select * from sys.sysdatabases where name not in (‘master’,‘tempdb’,‘model’,‘msdb’); –查询数据库中的表 select * from sysobjects where type=‘u’ ; – select * from sys.tables; –查询数据库中的对象类型 select distinct type from sysobjects; 共有以下类型 –查询某表对应的列信息 select *

    2023年04月09日
    浏览(55)
  • Mysql查询数据库连接状态及连接信息

    使用MySQL时,需要了解当前数据库的情况,例如当前的数据库大小、字符集、用户等等。下面总结了一些查看数据库相关信息的命令 查看显示所有数据库 查看当前使用的数据库 查看数据库使用端口 查看当前数据库大小 例如,我要查看INVOICE数据库的大小,那么可以通过下面

    2024年02月11日
    浏览(55)
  • 数据库信息速递 MONGODB 6.0 的新特性,更多的查询函数,加密查询,与时序数据集合 (译)...

    开头还是介绍一下群,如果感兴趣polardb ,mongodb ,mysql ,postgresql ,redis 等有问题,有需求都可以加群群内有各大数据库行业大咖,CTO,可以解决你的问题。加群请联系 liuaustin3 ,在新加的朋友会分到3群(共1000人左右 1 + 2 + 3),最近发展的速度比较快,2群除特殊情况,不在添加

    2024年02月16日
    浏览(43)
  • 几种常见数据库的表和列信息查询

    工作中如果和第三方做接口或者抽取数据,经常会用到不同的数据库的表结构信息以及列信息查询,本篇将简单总结一下 oracle,mysql,sqlsever 的表结构信息查询。 输出信息包括: 列名称,列类型,列长度,精度等信息 2.4.1 schemata 数据库信息 2.4.2 tables表信息 2.4.3 columns列信息 列

    2024年02月08日
    浏览(42)
  • 查询Oracle和MySQL数据库中当前所有连接信息

    查询Oracle当前所有连接信息: 查询MySQL当前所有连接信息: 在这两个查询中,我为每个字段添加了中文别名,以提高查询结果的可读性

    2024年02月12日
    浏览(69)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包