pandas dataframe获取列名、添加列名、列索引

这篇具有很好参考价值的文章主要介绍了pandas dataframe获取列名、添加列名、列索引。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1.获取列名

df = pd.DataFrame({'a': [1, 2, 4, np.nan,7, 9], 'b': ['a', 'b', np.nan, np.nan, 'd', 'e'], 'c': [np.nan, 0, 4, np.nan, np.nan, 5], 'd': [np.nan, np.nan, np.nan, np.nan, np.nan, np.nan]})

输出:
     a    b    c   d
0  1.0    a  NaN NaN
1  2.0    b  0.0 NaN
2  4.0  NaN  4.0 NaN
3  NaN  NaN  NaN NaN
4  7.0    d  NaN NaN
5  9.0    e  5.0 NaN

四种获取列名的方式:

print(df.columns) # 输出是一个index类型: Index(['a', 'b', 'c', 'd'], dtype='object'), 可以进行遍历,其每一个元素是string,
print(list(df)) # 输出是一个list: ['a', 'b', 'c', 'd']
print(df.keys) # 输出是: <bound method NDFrame.keys of      a    b    c   d    ,不可以进行遍历
print(df.keys())# 输出是:Index(['a', 'b', 'c', 'd'], dtype='object').,可以进行遍历,其每一个元素是string

2.添加列名

如果一个矩阵,将其变为dataframe格式,没有列名,打印行数、列数以及选取某一列,选取某一列时,直接df[index],注意想获取第三列,index应该等于2,列索引从0开始。

df = pd.DataFrame([[1, 2, 4, np.nan,7, 9], ['a', 'b', np.nan, np.nan, 'd', 'e'],  [np.nan, 0, 4, np.nan, np.nan, 5],  [np.nan, np.nan, np.nan, np.nan, np.nan, np.nan]])
print(df)
print(df.columns) # 会显示有多少列
print(df[2]) # 显示第三列,注意:列索引是从0开始
print(df.shape)  #输出是(4,6)4行6列

输出:
     0    1    2   3    4    5
0    1    2  4.0 NaN    7    9
1    a    b  NaN NaN    d    e
2  NaN    0  4.0 NaN  NaN    5
3  NaN  NaN  NaN NaN  NaN  NaN

RangeIndex(start=0, stop=6, step=1)

0    4.0
1    NaN
2    4.0
3    NaN
Name: 2, dtype: float64

想给他们添加列名,使用方法如下:

df.columns=['a','b','c','d','e','f']
print(df)
print(df['a'])

输出:
     0    1    2   3    4    5
0    1    2  4.0 NaN    7    9
1    a    b  NaN NaN    d    e
2  NaN    0  4.0 NaN  NaN    5
3  NaN  NaN  NaN NaN  NaN  NaN

     a    b    c   d    e    f
0    1    2  4.0 NaN    7    9
1    a    b  NaN NaN    d    e
2  NaN    0  4.0 NaN  NaN    5
3  NaN  NaN  NaN NaN  NaN  NaN

0      1
1      a
2    NaN
3    NaN
Name: a, dtype: object

3.列名覆盖

如果一个dataframe已经有列名字,可以进行覆盖。或者是当你不确定是否有列名,那么直接复制吧,反正是可以直接覆盖,按照你想命名的列名称呼这一列即可:文章来源地址https://www.toymoban.com/news/detail-618978.html

df = pd.DataFrame({'a': [1, 2, 4, np.nan,7, 9], 'b': ['a', 'b', np.nan, np.nan, 'd', 'e'], 'c': [np.nan, 0, 4, np.nan, np.nan, 5], 'd': [np.nan, np.nan, np.nan, np.nan, np.nan, np.nan]})
print(df)
df.columns = ['aa', 'bb', 'cc', 'dd']
print(df)

输出:
     a    b    c   d
0  1.0    a  NaN NaN
1  2.0    b  0.0 NaN
2  4.0  NaN  4.0 NaN
3  NaN  NaN  NaN NaN
4  7.0    d  NaN NaN
5  9.0    e  5.0 NaN
    aa   bb   cc  dd
0  1.0    a  NaN NaN
1  2.0    b  0.0 NaN
2  4.0  NaN  4.0 NaN
3  NaN  NaN  NaN NaN
4  7.0    d  NaN NaN
5  9.0    e  5.0 NaN

到了这里,关于pandas dataframe获取列名、添加列名、列索引的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Pandas DataFrame如何添加一行数据?

    在Pandas DataFrame中,我们经常需要添加新的行数据。这里介绍几种向DataFrame中添加一行数据的方法。 1. 使用.loc索引器 .loc索引器可以在DataFrame的尾部添加一条新行数据,语法如下: 例如: 2. 使用.append()方法 .append()方法可以向DataFrame尾部追加一行数据,语法如下: 例如: 3. 使用insert方

    2024年02月12日
    浏览(41)
  • 69_Pandas.DataFrame获取行号和列号

    将讲解如何从pandas.DataFrame的行名和列名中获取行号和列号,以及如何从列元素的值中获取行名和行号。 下面对内容进行说明。 根据行名和列名获取行号和列号 get_loc() 方法 当行名和列名重复时 列表索引、列 从列元素值获取行名称和行号 如果想从行号或列号中获取行、列或

    2024年02月01日
    浏览(38)
  • pandas dataframe获取所有行名称与列名称

    pandas中,dataframe获取行名称,可以有如下两种方式。 df.index为RangeIndex类型,df.index.values属性会输出一个numpy.ndarray类型的数组,将这个数组转化为list,就可以得到所有行名称的list。 该方法的输出为: 更多时候,我们是要想获得dataframe的列名,有如下三种方式。 第一种方式

    2024年02月13日
    浏览(49)
  • 【数据分析 - 基础入门之pandas篇③】- pandas数据结构——DataFrame

    大家好!我是一朵向阳花(花花花)🍭,本期跟大家分享的知识是 pandas 数据结构——DataFrame。 作者的【 Python 数据分析】专栏正在火热更新中🔥,如果本文对您有帮助,欢迎大家点赞 + 评论 + 收藏 ! 每日金句分享: 慢慢来,谁还没有一个努力的过程。』—— pony「网易云

    2024年02月16日
    浏览(43)
  • python中Pandas之DataFrame索引、选取数据

    总结一下 DataFrame 索引问题 先创建一个简单的 DataFrame 。 DataFrame 中有两种索引: 行索引( index ):对应最左边那一竖列 列索引( columns ):对应最上面那一横行 两种索引默认均为从 0 开始的自增整数。 可以使用 index 这个参数指定行索引, columns 这个参数指定列索引。 输出此时

    2023年04月08日
    浏览(48)
  • 【pandas】Python读取DataFrame的某行或某列

    行索引(index) :对应最左边那一竖列 列索引(columns) :对应最上面那一横行 .loc[]官方释义: Access a group of rows and columns by label(s) or a boolean array.(通过标签或布尔数组访问一组行和列) 官方链接 loc使用索引来取值,基础用法 df.loc[[行索引],[列索引]] .iloc[]官方释义: Purely inte

    2024年02月08日
    浏览(41)
  • 【Python】【pandas】打印 DataFrame 的每一列数据类型。

    可以使用 dtypes 属性来打印 DataFrame 的每一列数据类型。 dtypes 属性返回一个 Series,其中包含每个列的名称和对应的数据类型。 以下是打印 DataFrame 每一列数据类型的示例代码: 这将输出一个包含列名和数据类型的 Series。每一行都代表 DataFrame 的一列,列名作为索引,数据类

    2024年02月14日
    浏览(47)
  • 【python】【pandas】读取DataFrame的某一列形成一个列表

    输出结果: 在上述代码中,我们创建了一个示例DataFrame df ,其中包含三列(\\\'A\\\'、\\\'B\\\'、\\\'C\\\'),每列都有一些示例值。 然后,我们使用 df.iloc[:, 1] 来访问DataFrame的第一列。这里的 iloc[:, 1] 表示选择所有行(使用 : ),并选择索引为1的列(即第二列)。 接下来,我们使用 tolist

    2024年02月11日
    浏览(45)
  • 【python】pandas-DataFrame类型数据重命名列表头

    目录 0.环境 1.将DataFrame类型数据某一列重命名 windows + jupyter notebook + python  使用场景: 在处理数据对齐的问题时,两个表格的对齐列名不相同(一个数据集是DataFrame类型,一个数据集是geopandas类型),所以想修改一下DataFrame类型数据的某一列名字,特此记录分享 1)重命名前

    2024年02月14日
    浏览(60)
  • Python中Pandas库提供的函数——pd.DataFrame的基本用法

    pd.DataFrame 是 Pandas 库中的一个类,用于创建和操作数据框(DataFrame)。DataFrame 是 Pandas 的核心数据结构,用于以表格形式和处理数据,类似提供电子表格或数据库表格。类了创建 pd.DataFrame 数据框、访问数据、进行数据操作和分析的方法和属性。 表格形式 :DataFrame是一个二维

    2024年02月05日
    浏览(56)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包