Python大数据之pandas快速入门(二)-Toy模板网

这篇具有很好参考价值的文章主要介绍了Python大数据之pandas快速入门(二)。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

3. DataFrame 的行列标签和行列位置编号

3.1 DataFrame 的行标签和列标签

1）如果所示，分别是 DataFrame 的行标签和列标签

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

2）获取 DataFrame 的行标签

# 获取 DataFrame 的行标签
china.index

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

3）获取 DataFrame 的列标签

# 获取 DataFrame 的列标签
china.columns

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

4）设置 DataFrame 的行标签

# 注意：DataFrame设置行标签时，并不会改变原来的DataFrame，而是返回的副本
china_df = china.set_index('year')

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

3.2 DataFrame 的行位置编号和列位置编号

DataFrame 除了行标签和列标签之外，还具有行列位置编号。

行位置编号：从上到下，第1行编号为0，第二行编号为1，…，第n行编号为n-1

列位置编号：从左到右，第1列编号为0，第二列编号为1，…，第n列编号为n-1

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

注意：默认情况下，行标签和行位置编号是一样的。

4. DataFrame 获取指定行列的数据

以下示例都使用加载的 gapminder.tsv 数据集进行操作，注意将 year 这一列设置为行标签。

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

4.1 loc函数获取指定行列的数据

基本格式：

语法	说明
`df.loc[[行标签1, ...], [列标签1, ...]]`	根据行标签和列标签获取对应行的对应列的数据，结果为：DataFrame
`df.loc[[行标签1, ...]]`	根据行标签获取对应行的所有列的数据结果为：DataFrame
`df.loc[:, [列标签1, ...]]`	根据列标签获取所有行的对应列的数据结果为：DataFrame
`df.loc[行标签]`	1）如果结果只有一行，结果为：Series 2）如果结果有多行，结果为：DataFrame
`df.loc[[行标签]]`	无论结果是一行还是多行，结果为DataFrame
`df.loc[[行标签], 列标签]`	1）如果结果只有一列，结果为：Series，行标签作为 Series 的索引标签 2）如果结果有多列，结果为：DataFrame
`df.loc[行标签, [列标签]]`	1）如果结果只有一行，结果为：Series，列标签作为 Series 的索引标签 2）如果结果有多行，结果为DataFrame
`df.loc[行标签, 列标签]`	1）如果结果只有一行一列，结果为单个值 2）如果结果有多行一列，结果为：Series，行标签作为 Series 的索引标签 3）如果结果有一行多列，结果为：Series，列标签作为 Series 的索引标签 4）如果结果有多行多列，结果为：DataFrame

演示示例：

示例1：获取行标签为 1952, 1962, 1972 行的 country、pop、gdpPercap 列的数据
示例2：获取行标签为 1952, 1962, 1972 行的所有列的数据
示例3：获取所有行的 country、pop、gdpPercap 列的数据
示例4：获取行标签为 1957 行的所有列的数据
示例5：获取行标签为 1957 行的 lifeExp 列的数据

示例实现：

1）示例1：获取行标签为 1952, 1962, 1972 行的 country、pop、gdpPercap 列的数据

# 示例1：获取行标签为 1952, 1962, 1972 行的 country、pop、gdpPercap 列的数据
china_df.loc[[1952, 1962, 1972], ['country', 'pop', 'gdpPercap']]

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

2）示例2：获取行标签为 1952, 1962, 1972 行的所有列的数据

# 示例2：获取行标签为 1952, 1962, 1972 行的所有列的数据
china_df.loc[[1952, 1962, 1972]]

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

3）示例3：获取所有行的 country、pop、gdpPercap 列的数据

# 示例3：获取所有行的 country、pop、gdpPercap 列的数据
china_df.loc[:, ['country', 'pop', 'gdpPercap']]

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

4）示例4：获取行标签为 1957 行的所有列的数据

# 示例4：获取行标签为 1957 行的所有列的数据
china_df.loc[1957]

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

# 示例4：获取行标签为 1957 行的所有列的数据
china_df.loc[[1957]]

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

5）示例5：获取行标签为 1957 行的 lifeExp 列的数据

# 示例5：获取行标签为 1957 行的 lifeExp 列的数据
china_df.loc[[1957], 'lifeExp']
或
china_df.loc[1957, ['lifeExp']]
或
china_df.loc[1957, 'lifeExp']

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

4.2 iloc函数获取指定行列的数据

基本格式：

语法	说明
`df.iloc[[行位置1, ...], [列位置1, ...]]`	根据行位置和列位置获取对应行的对应列的数据，结果为：DataFrame
`df.iloc[[行位置1, ...]]`	根据行位置获取对应行的所有列的数据结果为：DataFrame
`df.iloc[:, [列位置1, ...]]`	根据列位置获取所有行的对应列的数据结果为：DataFrame
`df.iloc[行位置]`	结果只有一行，结果为：Series
`df.iloc[[行位置]]`	结果只有一行，结果为：DataFrame
`df.iloc[[行位置], 列位置]`	结果只有一行一列，结果为：Series，行标签作为 Series 的索引标签
`df.iloc[行位置, [行位置]]`	结果只有一行一列，结果为：Series，列标签作为 Series 的索引标签
`df.iloc[行位置, 行位置]`	结果只有一行一列，结果为单个值

演示示例：

示例1：获取行位置为 0, 2, 4 行的 0、1、2 列的数据
示例2：获取行位置为 0, 2, 4 行的所有列的数据
示例3：获取所有行的列位置为 0、1、2 列的数据
示例4：获取行位置为 1 行的所有列的数据
示例5：获取行位置为 1 行的列位置为 2 列的数据

示例实现：

1）示例1：获取行位置为 0, 2, 4 行的 0、1、2 列的数据

# 示例1：获取行位置为 0, 2, 4 行的 0、1、2 列的数据
china_df.iloc[[0, 2, 4], [0, 1, 2]]

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

2）示例2：获取行位置为 0, 2, 4 行的所有列的数据

# 示例2：获取行位置为 0, 2, 4 行的所有列的数据
china_df.iloc[[0, 2, 4]]

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

3）示例3：获取所有行的列位置为 0、1、2 列的数据

# 示例3：获取所有行的列位置为 0、1、2 列的数据
china_df.iloc[:, [0, 1, 2]]

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

4）示例4：获取行位置为 1 行的所有列的数据

# 示例4：获取行位置为 1 行的所有列的数据
china_df.iloc[1]

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

# 示例4：获取行位置为 1 行的所有列的数据
china_df.iloc[[1]]

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

5）示例5：获取行位置为 1 行的列位置为 2 列的数据

# 示例5：获取行位置为 1 行的列位置为 2 列的数据
china_df.iloc[[1], 2]
或
china_df.iloc[1, [2]]
或
china_df.iloc[1, 2]

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

4.3 loc和iloc的切片操作

基本格式：

语法	说明
`df.loc[起始行标签:结束行标签, 起始列标签:结束列标签]`	根据行列标签范围获对应行的对应列的数据，包含起始行列标签和结束行列标签
`df.iloc[起始行位置:结束行位置, 起始列位置:结束列位置]`	根据行列标签位置获对应行的对应列的数据，包含起始行列位置，但不包含结束行列位置

演示示例：

示例1：获取 china_df 中前三行的前三列的数据，分别使用上面介绍的loc和iloc实现

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

示例实现：

1）示例1：获取 china_df 中前三行的前三列的数据，分别使用上面介绍的loc和iloc实现

# 示例1：获取 china_df 中前三行的前三列的数据，分别使用上面介绍的loc和iloc实现
china_df.loc[1952:1962, 'country':'lifeExp']
或
china_df.iloc[0:3, 0:3]

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

4.4 [] 语法获取指定行列的数据

基本格式：

语法	说明
`df[['列标签1', '列标签2', ...]]`	根据列标签获取所有行的对应列的数据，结果为：DataFrame
`df['列标签']`	根据列标签获取所有行的对应列的数据 1）如果结果只有一列，结果为：Series，行标签作为 Series 的索引标签 2）如果结果有多列，结果为：DataFrame
`df[['列标签']]`	根据列标签获取所有行的对应列的数据，结果为：DataFrame
`df[起始行位置:结束行位置]`	根据指定范围获取对应行的所有列的数据，不包括结束行位置

演示示例：

示例1：获取所有行的 country、pop、gdpPercap 列的数据
示例2：获取所有行的 pop 列的数据
示例3：获取前三行的数据
示例4：从第一行开始，每隔一行获取一行数据，一共获取3行

示例实现：

1）示例1：获取所有行的 country、pop、gdpPercap 列的数据

# 示例1：获取所有行的 country、pop、gdpPercap 列的数据
china_df[['country', 'pop', 'gdpPercap']]

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

2）示例2：获取所有行的 pop 列的数据

# 示例2：获取所有行的 pop 列的数据
china_df['pop']

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

# 示例2：获取所有行的 pop 列的数据
china_df[['pop']]

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

3）示例3：获取前三行的数据

# 示例3：获取前三行的数据
china_df[0:3]

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas

4）示例4：从第一行开始，每隔一行获取一行数据，一共获取3行

# 示例4：从第一行开始，每隔一行获取一行数据，一共获取3行
china_df[0:6:2]

Python大数据之pandas快速入门(二),# Pandas,python大数据,python,大数据,pandas 文章来源地址https://www.toymoban.com/news/detail-752723.html

总结

能够知道 DataFrame 和 Series 数据结构
能够加载 csv 和 tsv 数据集
能够区分 DataFrame 的行列标签和行列位置编号
能够获取 DataFrame 指定行列的数据
- loc
- iloc
- loc和iloc的切片操作
- []

到了这里，关于Python大数据之pandas快速入门(二)的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

Python大数据之pandas快速入门(二)

3. DataFrame 的行列标签和行列位置编号

3.1 DataFrame 的行标签和列标签

3.2 DataFrame 的行位置编号和列位置编号

4. DataFrame 获取指定行列的数据

4.1 loc函数获取指定行列的数据

4.2 iloc函数获取指定行列的数据

4.3 loc和iloc的切片操作

4.4 [] 语法获取指定行列的数据

总结

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2