python入门——DataFrame创建和索引

这篇具有很好参考价值的文章主要介绍了python入门——DataFrame创建和索引。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

DataFrame是Pandas中常用的数据结构,即表示矩阵的数据表,包含已排序的列集合,既有行索引又有列索引。使用前需先导入pandas(import pandas as pd)。

一、DataFrame的创建

1、利用包含等长度列表活Numpy数组的字典创建。

data={'state':['Ohio','Ohio','Ohio','Nevada','Nevada','Nevada'],
     'year':[2000,2001,2002,2001,2002,2003],
     'pop':[1.5,1.7,3.6,2.4,2.9,3.2]}
frame=pd.DataFrame(data)

可以看到创建的DataFrame如下:

dataframe索引,python入门,python,pandas

2、利用嵌套字典创建

#嵌套字典方式创建,用大括号
qiantao={'Nevada':{2001:2.4,2002:2.9},
        'Ohio':{2000:1.5,2001:1.7,2002:3.6}}
frame2=pd.DataFrame(qiantao)
frame2

dataframe索引,python入门,python,pandas

3、 用DataFrame中原series创建

#包含series的字典创建
pdata={'Ohio':frame2['Ohio'][:-1],
      'Nevada':frame2['Nevada'][:2]}
pd.DataFrame(pdata)

dataframe索引,python入门,python,pandas

附:DataFrame构造函数的有效输入类型: 

dataframe索引,python入门,python,pandas

 二、行列索引及变换

 1、指定列的顺序,按顺序排列

dataframe索引,python入门,python,pandas

2、如果列不在字典中,显示缺失值

dataframe索引,python入门,python,pandas

3、重新定义行索引,并按顺序排列

dataframe索引,python入门,python,pandas

4、检索某一列的两种方式

dataframe索引,python入门,python,pandas

利用索引方式创建列(如果列不存在,会增加新列)

frame['eastern']=frame.state=='Ohio'
frame

 dataframe索引,python入门,python,pandas

用series创建新列,注意创建时值的长度需要匹配,否则补充NaN

val=pd.Series([1.2,-1.5,-1.7],index=[2,4,5])
frame['debt']=val
frame

dataframe索引,python入门,python,pandas

5、也可以通过位置或者loc选取行,如选取第三行,用位置“2”

dataframe索引,python入门,python,pandas

6、修改列引用

dataframe索引,python入门,python,pandas

7、删除某列

dataframe索引,python入门,python,pandas

8、矩阵转置 

dataframe索引,python入门,python,pandas

9、添加行列名

frame2.index.name='year'
frame2.columns.name='state'
frame2

dataframe索引,python入门,python,pandas

10.values属性

dataframe索引,python入门,python,pandas

 三、索引对象

索引对象用于存储轴标签和其他数据,Series和DataFrame的任意数组或序列标签都可以转换为索引对象。索引对象不可变,不可修改。

我们可以先看一下之前的DataFrame的索引对象

dataframe索引,python入门,python,pandas

1、存放索引对象a,b,c

obj=pd.Series(range(3),index=['a','b','c'])
index=obj.index

 dataframe索引,python入门,python,pandas

2、调用存放好的索引对象labels

labels=pd.Index(np.arange(3))
obj2=pd.Series([1.5,-2.5,0],index=labels)

dataframe索引,python入门,python,pandas

 3、索引对象可以包含重复标签

dataframe索引,python入门,python,pandas

参考:Wes McKinney《利用python进行数据分析》

 、文章来源地址https://www.toymoban.com/news/detail-702952.html

到了这里,关于python入门——DataFrame创建和索引的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • pandas---Series与DataFrame索引、切片;多层索引、索引的堆叠

    1. Series的索引和切片 1.1 Series的索引: 可以使用中括号取单个索引(此时返回的是元素类型),或者中括号里一个列表取多个索引(此时 返回的仍然是一个Series类型)。分为显示索引和隐式索引: (1) 显式索引: 使用index中的元素作为索引值 使用.loc[ ] (2) 隐式索引: 使用整

    2024年02月09日
    浏览(47)
  • 【Python】数据科学工具(Numpy Pandas np.array() 创建访问数组 向量与矩阵 Series DataFrame)

    1.Numpy numpy是Python中一个非常重要的科学计算库,其最基础的功能就是N维数组对象——ndarray。 1.1 数组的创建 1)np.array() 用 np.array() 函数可以将Python的序列对象(如列表、元组)转换为ndarray数组。 2)arange、linspace、logspace np.arange(start, stop, step) :创建一个一维数组,其中的值

    2024年02月10日
    浏览(48)
  • 【数据分析 - 基础入门之pandas篇③】- pandas数据结构——DataFrame

    大家好!我是一朵向阳花(花花花)🍭,本期跟大家分享的知识是 pandas 数据结构——DataFrame。 作者的【 Python 数据分析】专栏正在火热更新中🔥,如果本文对您有帮助,欢迎大家点赞 + 评论 + 收藏 ! 每日金句分享: 慢慢来,谁还没有一个努力的过程。』—— pony「网易云

    2024年02月16日
    浏览(45)
  • 【pandas】Python读取DataFrame的某行或某列

    行索引(index) :对应最左边那一竖列 列索引(columns) :对应最上面那一横行 .loc[]官方释义: Access a group of rows and columns by label(s) or a boolean array.(通过标签或布尔数组访问一组行和列) 官方链接 loc使用索引来取值,基础用法 df.loc[[行索引],[列索引]] .iloc[]官方释义: Purely inte

    2024年02月08日
    浏览(42)
  • 【python】【pandas】dataframe按照列名给列排序

    输出结果: 在上述代码中,我们首先创建了一个示例DataFrame。然后,我们使用 sort_values() 方法对DataFrame的列进行排序。通过指定 by=df.columns ,我们将按照列名的字母顺序对列进行排序。最后,通过设置 axis=1 参数,我们指定按列进行排序。 执行上述代码后,DataFrame的列将按照

    2024年02月15日
    浏览(50)
  • 【Python】【pandas】打印 DataFrame 的每一列数据类型。

    可以使用 dtypes 属性来打印 DataFrame 的每一列数据类型。 dtypes 属性返回一个 Series,其中包含每个列的名称和对应的数据类型。 以下是打印 DataFrame 每一列数据类型的示例代码: 这将输出一个包含列名和数据类型的 Series。每一行都代表 DataFrame 的一列,列名作为索引,数据类

    2024年02月14日
    浏览(47)
  • 【python】【pandas】读取DataFrame的某一列形成一个列表

    输出结果: 在上述代码中,我们创建了一个示例DataFrame df ,其中包含三列(\\\'A\\\'、\\\'B\\\'、\\\'C\\\'),每列都有一些示例值。 然后,我们使用 df.iloc[:, 1] 来访问DataFrame的第一列。这里的 iloc[:, 1] 表示选择所有行(使用 : ),并选择索引为1的列(即第二列)。 接下来,我们使用 tolist

    2024年02月11日
    浏览(46)
  • 【python】pandas-DataFrame类型数据重命名列表头

    目录 0.环境 1.将DataFrame类型数据某一列重命名 windows + jupyter notebook + python  使用场景: 在处理数据对齐的问题时,两个表格的对齐列名不相同(一个数据集是DataFrame类型,一个数据集是geopandas类型),所以想修改一下DataFrame类型数据的某一列名字,特此记录分享 1)重命名前

    2024年02月14日
    浏览(66)
  • Python中Pandas库提供的函数——pd.DataFrame的基本用法

    pd.DataFrame 是 Pandas 库中的一个类,用于创建和操作数据框(DataFrame)。DataFrame 是 Pandas 的核心数据结构,用于以表格形式和处理数据,类似提供电子表格或数据库表格。类了创建 pd.DataFrame 数据框、访问数据、进行数据操作和分析的方法和属性。 表格形式 :DataFrame是一个二维

    2024年02月05日
    浏览(57)
  • Python Pandas:DataFrame 一列切分成多列、分隔符切分选字段

    创建一个复杂又简单的数据集 split expand:这个参数直接将分列后的结果转换成 DataFrame drop axis 是指处哪一个轴 columns 是指某一列或者多列 inplaces 是否替换原来的 dataframe

    2024年02月12日
    浏览(67)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包