python入门——DataFrame创建和索引

10月前作者：joy在学习分类：Toy博客阅读(61) 违法举报

这篇具有很好参考价值的文章主要介绍了python入门——DataFrame创建和索引。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

DataFrame是Pandas中常用的数据结构，即表示矩阵的数据表，包含已排序的列集合，既有行索引又有列索引。使用前需先导入pandas(import pandas as pd)。

一、DataFrame的创建

1、利用包含等长度列表活Numpy数组的字典创建。

data={'state':['Ohio','Ohio','Ohio','Nevada','Nevada','Nevada'],
     'year':[2000,2001,2002,2001,2002,2003],
     'pop':[1.5,1.7,3.6,2.4,2.9,3.2]}
frame=pd.DataFrame(data)

可以看到创建的DataFrame如下：

dataframe索引,python入门,python,pandas

2、利用嵌套字典创建

#嵌套字典方式创建,用大括号
qiantao={'Nevada':{2001:2.4,2002:2.9},
        'Ohio':{2000:1.5,2001:1.7,2002:3.6}}
frame2=pd.DataFrame(qiantao)
frame2

dataframe索引,python入门,python,pandas

3、用DataFrame中原series创建

#包含series的字典创建
pdata={'Ohio':frame2['Ohio'][:-1],
      'Nevada':frame2['Nevada'][:2]}
pd.DataFrame(pdata)

dataframe索引,python入门,python,pandas

附：DataFrame构造函数的有效输入类型：

dataframe索引,python入门,python,pandas

二、行列索引及变换

1、指定列的顺序，按顺序排列

dataframe索引,python入门,python,pandas

2、如果列不在字典中，显示缺失值

dataframe索引,python入门,python,pandas

3、重新定义行索引，并按顺序排列

dataframe索引,python入门,python,pandas

4、检索某一列的两种方式

dataframe索引,python入门,python,pandas

利用索引方式创建列（如果列不存在，会增加新列）

frame['eastern']=frame.state=='Ohio'
frame

dataframe索引,python入门,python,pandas

用series创建新列，注意创建时值的长度需要匹配，否则补充NaN

val=pd.Series([1.2,-1.5,-1.7],index=[2,4,5])
frame['debt']=val
frame

dataframe索引,python入门,python,pandas

5、也可以通过位置或者loc选取行，如选取第三行，用位置“2”

dataframe索引,python入门,python,pandas

6、修改列引用

dataframe索引,python入门,python,pandas

7、删除某列

dataframe索引,python入门,python,pandas

8、矩阵转置

dataframe索引,python入门,python,pandas

9、添加行列名

frame2.index.name='year'
frame2.columns.name='state'
frame2

dataframe索引,python入门,python,pandas

10.values属性

dataframe索引,python入门,python,pandas

三、索引对象

索引对象用于存储轴标签和其他数据，Series和DataFrame的任意数组或序列标签都可以转换为索引对象。索引对象不可变，不可修改。

我们可以先看一下之前的DataFrame的索引对象

dataframe索引,python入门,python,pandas

1、存放索引对象a,b,c

obj=pd.Series(range(3),index=['a','b','c'])
index=obj.index

dataframe索引,python入门,python,pandas

2、调用存放好的索引对象labels

labels=pd.Index(np.arange(3))
obj2=pd.Series([1.5,-2.5,0],index=labels)

dataframe索引,python入门,python,pandas

3、索引对象可以包含重复标签

dataframe索引,python入门,python,pandas

参考：Wes McKinney《利用python进行数据分析》

、文章来源地址https://www.toymoban.com/news/detail-702952.html

到了这里，关于python入门——DataFrame创建和索引的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

pandas---Series与DataFrame索引、切片；多层索引、索引的堆叠

1. Series的索引和切片 1.1 Series的索引：可以使用中括号取单个索引（此时返回的是元素类型），或者中括号里一个列表取多个索引（此时返回的仍然是一个Series类型）。分为显示索引和隐式索引： (1) 显式索引：使用index中的元素作为索引值使用.loc[ ] (2) 隐式索引：使用整

2024年02月09日
浏览(47)
【Python】数据科学工具（Numpy Pandas np.array() 创建访问数组向量与矩阵 Series DataFrame）

1.Numpy numpy是Python中一个非常重要的科学计算库，其最基础的功能就是N维数组对象——ndarray。 1.1 数组的创建 1）np.array() 用 np.array() 函数可以将Python的序列对象（如列表、元组）转换为ndarray数组。 2）arange、linspace、logspace np.arange(start, stop, step) ：创建一个一维数组，其中的值

2024年02月10日
浏览(48)
【数据分析 - 基础入门之pandas篇③】- pandas数据结构——DataFrame

大家好！我是一朵向阳花（花花花）🍭，本期跟大家分享的知识是 pandas 数据结构——DataFrame。作者的【 Python 数据分析】专栏正在火热更新中🔥，如果本文对您有帮助，欢迎大家点赞 + 评论 + 收藏！每日金句分享：慢慢来，谁还没有一个努力的过程。』—— pony「网易云

2024年02月16日
浏览(45)
【pandas】Python读取DataFrame的某行或某列

行索引(index) ：对应最左边那一竖列列索引(columns) ：对应最上面那一横行 .loc[]官方释义： Access a group of rows and columns by label(s) or a boolean array.（通过标签或布尔数组访问一组行和列）官方链接 loc使用索引来取值，基础用法 df.loc[[行索引],[列索引]] .iloc[]官方释义： Purely inte

2024年02月08日
浏览(42)
【python】【pandas】dataframe按照列名给列排序

输出结果：在上述代码中，我们首先创建了一个示例DataFrame。然后，我们使用 sort_values() 方法对DataFrame的列进行排序。通过指定 by=df.columns ，我们将按照列名的字母顺序对列进行排序。最后，通过设置 axis=1 参数，我们指定按列进行排序。执行上述代码后，DataFrame的列将按照

2024年02月15日
浏览(50)
【Python】【pandas】打印 DataFrame 的每一列数据类型。

可以使用 dtypes 属性来打印 DataFrame 的每一列数据类型。 dtypes 属性返回一个 Series，其中包含每个列的名称和对应的数据类型。以下是打印 DataFrame 每一列数据类型的示例代码：这将输出一个包含列名和数据类型的 Series。每一行都代表 DataFrame 的一列，列名作为索引，数据类

2024年02月14日
浏览(47)
【python】【pandas】读取DataFrame的某一列形成一个列表

输出结果：在上述代码中，我们创建了一个示例DataFrame df ，其中包含三列（\\\'A\\\'、\\\'B\\\'、\\\'C\\\'），每列都有一些示例值。然后，我们使用 df.iloc[:, 1] 来访问DataFrame的第一列。这里的 iloc[:, 1] 表示选择所有行（使用 : ），并选择索引为1的列（即第二列）。接下来，我们使用 tolist

2024年02月11日
浏览(46)
【python】pandas-DataFrame类型数据重命名列表头

目录 0.环境 1.将DataFrame类型数据某一列重命名 windows + jupyter notebook + python 使用场景：在处理数据对齐的问题时，两个表格的对齐列名不相同（一个数据集是DataFrame类型，一个数据集是geopandas类型），所以想修改一下DataFrame类型数据的某一列名字，特此记录分享 1）重命名前

2024年02月14日
浏览(66)
Python中Pandas库提供的函数——pd.DataFrame的基本用法

pd.DataFrame 是 Pandas 库中的一个类，用于创建和操作数据框（DataFrame）。DataFrame 是 Pandas 的核心数据结构，用于以表格形式和处理数据，类似提供电子表格或数据库表格。类了创建 pd.DataFrame 数据框、访问数据、进行数据操作和分析的方法和属性。表格形式：DataFrame是一个二维

2024年02月05日
浏览(57)
Python Pandas：DataFrame 一列切分成多列、分隔符切分选字段

创建一个复杂又简单的数据集 split expand：这个参数直接将分列后的结果转换成 DataFrame drop axis 是指处哪一个轴 columns 是指某一列或者多列 inplaces 是否替换原来的 dataframe

2024年02月12日
浏览(67)