pandas基础知识、Series结构

这篇具有很好参考价值的文章主要介绍了pandas基础知识、Series结构。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

文章目录

一、pandas是什么?

二、pandas库下载和安装

三、pandas Series结构


一、pandas是什么?

pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。

1.pandas 主要特点

  • 它提供了一个简单、高效、带有默认标签(也可以自定义标签)的 DataFrame 对象。
  • 能够快速得从不同格式的文件中加载数据(比如 Excel、CSV 、SQL文件),然后将其转换为可处理的对象;
  • 能够按数据的行、列标签进行分组,并对分组后的对象执行聚合和转换操作;
  • 能够很方便地实现数据归一化操作和缺失值处理;
  • 能够很方便地对 DataFrame 的数据列进行增加、修改或者删除的操作;
  • 能够处理不同格式的数据集,比如矩阵数据、异构数据表、时间序列等;
  • 提供了多种处理数据集的方式,比如构建子集、切片、过滤、分组以及重新排序等。

2.pandas主要优势:

  • Pandas 的 DataFrame 和 Series 构建了适用于数据分析的存储结构;
  • Pandas 简洁的 API 能够让你专注于代码的核心层面;
  • Pandas 实现了与其他库的集成,比如 Scipy、scikit-learn 和 Matplotlib;
  • Pandas 官方网站(点击访问)提供了完善资料支持,及其良好的社区环境。

3.pandas内置数据结构

在ndarray数组(numpy 中数组)的基础上构建了两种不同的数据结构,分别是Series(一维数据结构),DataFrame(二维数据结构)

  • Series是一种一维数组对象,包含一个值序列,并且包含数据标签,称为索引(index),通过索引来访问数组中的数据。
  • DataFrame是一种表格型数据结构,它既有行标签(index),又有列标签(coumns)

二、pandas库下载和安装

python官方标准发行版并没有自带pandas库,因此需要另行安装。

1.Windows系统安装

使用pip包管理器安装pandas,是最简单的一种安装方式。在CMD命令提示符界面执行以下命令:

pip install pandas

三、pandas Series结构

Series 可以保存任何数据类型,比如整数、字符串、浮点数、python对象等,它的标签默认为整数,从0开始依次递增。

1.创建Series对象

pandas使用Series()函数来创建Series对象,通过这个对象可以调用相应的方法和属性,从而达到处理数据的目的

import pandas as pd
s = pd.Series(data,index,dtype,copy)

1.1.创建一个空的Series对象

import pandas as pd
# 输入数据为空
s = pd.Series()
print(s)

结果:Series([], dtype: object)

 1.2.ndarray创建Series对象:

ndarray是numpy中的数组类型,当data是ndarray时,传递的索引必须具有与数组相同的长度。

# 使用默认索引创建Series序列对象
import pandas as pd
import numpy as np
data = np.array(['a','b','c','d'])
s = pd.Series(data)
print(s)
结果:
0    a
1    b
2    c
3    d
dtype: object

1.3.dict创建Series对象:

# 没有传递索引时
import pandas as pd
import numpy as np
data = {'a':0,'b':1,'c':2}
s = pd.Series(data)
print(s)
#为index参数传递索引时:
s1 = pd.Series(data,index=['b','c','d','a'])
print(s1)

1.4.标量创建Series对象:

如果data是标量值,则必须提供索引

import pandas as pd
s = pd.Series(5,index=[0,1,2,3])
print(s)
结果:
0    5
1    5
2    5
3    5
dtype: int64

2.访问Series数据:

2.1. 位置索引访问:

import pandas as pd
s = pd.Series([1,2,3,4,5],index=['a','b','c','d','e'])
print(s[0])
print(s['a'])
print(s[:3])
print(s[-3:])
结果:
1
1
------------------
a    1
b    2
c    3
dtype: int64
------------------
c    3
d    4
e    5
dtype: int64

2.2.索引标签访问:

import pandas as pd
s = pd.Series([11,12,13,14,15],index=['a','b','c','d','e'])
print(s['a'])
print(s[['a','c','d']])
结果:
11
a    11
c    13
d    14
dtype: int64

3.Series常用属性

  • axes:以列表的形式返回所有行索引标签
  • dtype:返回对象的数据类型
  • empty:返回一个空的Series对象
  • ndim:返回输入数据的维数
  • size:返回输入数据的元素数量
  • values:以ndarray的形式返回Series对象
  • index:返回一个Rangelndex对象,原来描述索引的取值范围

4.Series常用方法:文章来源地址https://www.toymoban.com/news/detail-831188.html

  • head():返回前n行数据
  • tail():返回后n行数据
  • isnull():如果值不存在或缺失,则返回True。
  • notnull():如果值不存在或缺失,则返回False。

到了这里,关于pandas基础知识、Series结构的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Pandas 数据分析系列1--Series&DataFrame数据结构详解

       P andas 是一个开源的数据分析和数据处理库,是基于 NumPy 开发的。它提供了灵活且高效的数据结构,使得处理和分析结构化、缺失和时间序列数据变得更加容易。其在数据分析和数据处理领域广泛应用,在金融、社交媒体、科学研究等领域都有很高的使用率和广泛的应用

    2024年02月08日
    浏览(38)
  • 数据结构~二叉树(基础知识)

    上一篇博客我们对树有了初步了解与学习,这篇我将初步学习二叉树!!(新年快乐!) 目录 二叉树   1、定义: 2、特点: 3、基本形态: 4、二叉树的种类: (1)满二叉树 (2)完全二叉树 (效率高) (3)斜树 5、二叉树的性质:  6、二叉树的存储: 1、定义: 二叉树

    2024年02月19日
    浏览(48)
  • 数据结构基础知识、名词概述

    整体知识框架 1.1.1 数据、 数据元素、 数据项和数据对象 数据 (Data) 是客观事物的符号表示,是所有 能输入到计算机中并被计算机程序处理的符号 的总称 。如数学计算中用到的整数和实数,文本编辑中用到的字符串,多媒体程序处理的图形、 图像、声音及动画等通过特殊编

    2024年02月15日
    浏览(49)
  • 【C++】基础知识--程序的结构(1)

    C++简介: C++ 是一种静态类型的、编译式的、通用的、大小写敏感的、不规则的编程语言,支持过程化编程、面向对象编程和泛型编程。 C++ 被认为是一种中级语言,它综合了高级语言和低级语言的特点。 C++ 是由 Bjarne Stroustrup 于 1979 年在新泽西州美利山贝尔实验室开始设计开

    2024年02月06日
    浏览(38)
  • 【数据分析专栏之Python篇】五、pandas数据结构之Series

    大家好!本期跟大家分享的知识是 Pandas 数据结构—Series。 Series 是一种类似于一维数组的对象,由下面两部分组成: values :一组数据,ndarray 类型 index :数据索引 顾名思义 ,我们在创建 Series 对象时,需要传递一组数据,该数据大多数时候是可迭代对象。因此,下面三种创

    2024年02月14日
    浏览(56)
  • 【数据结构】树的基础知识及三种存储结构

    💐 🌸 🌷 🍀 🌹 🌻 🌺 🍁 🍃 🍂 🌿 🍄🍝 🍛 🍤 📃 个人主页 :阿然成长日记 👈点击可跳转 📆 个人专栏: 🔹数据结构与算法🔹C语言进阶 🚩 不能则学,不知则问,耻于问人,决无长进 🍭 🍯 🍎 🍏 🍊 🍋 🍒 🍇 🍉 🍓 🍑 🍈 🍌 🍐 🍍 把它叫做树是因为它

    2024年02月09日
    浏览(48)
  • 数据结构—基础知识:哈夫曼树

    哈夫曼(Huffman)树 又称最优树,是一类带权路径长度最短的树,在实际中有广泛的用途。哈夫曼树的定义,涉及路径、路径长度、权等概念,下面先给出这些概念的定义,然后再介绍哈夫曼树 路径 :从树中一个结点到另一个结点之间的分支构成这两个结点之间的路径。 路

    2024年02月21日
    浏览(43)
  • 【数据结构】——二叉树的基础知识

    数的分类 二叉树、多叉树 数的概念 树是一种 非线性 的数据结构,它是由n(n=0)个有限节点组成一个具有层次关系的集合。 把它叫做树的原因是它看起来像一颗倒挂的树,也就是说它是跟朝上,而叶朝下的。 有一个特殊的节点,称为根节点,这个节点没有前驱节点。 除根节

    2024年02月07日
    浏览(38)
  • 数据结构—基础知识(15):哈夫曼树

    哈夫曼(Huffman)树 又称最优树,是一类带权路径长度最短的树,在实际中有广泛的用途。哈夫曼树的定义,涉及路径、路径长度、权等概念,下面先给出这些概念的定义,然后再介绍哈夫曼树 路径 :从树中一个结点到另一个结点之间的分支构成这两个结点之间的路径。 路

    2024年02月19日
    浏览(45)
  • 【数据结构】C--单链表(小白入门基础知识)

    前段时间写了一篇关于顺序表的博客,http://t.csdn.cn/0gCRp 顺序表在某些时候存在着一些不可避免的缺点: 问题: 1. 中间 / 头部的插入删除,时间复杂度为 O(N) 2. 增容需要申请新空间,拷贝数据,释放旧空间。会有不小的消耗。 3. 增容一般是呈 2 倍的增长,势必会有一定的空间

    2024年02月16日
    浏览(48)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包