Numpy&Pandas的区别和联系

这篇具有很好参考价值的文章主要介绍了Numpy&Pandas的区别和联系。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

一、Numpy

二、Pandas


一、Numpy

numpy是以矩阵为基础的数学计算模块,提供高性能的矩阵运算,数组结构为ndarray

首先需要明确数组与列表的区别:数组是一种特殊变量,虽与列表相似,但列表可以存储任意类型的数据,数组只能存储一种类型的数据,同时,数组提供了许多方便统计计算的功能(如平均值mean、标准差std等)。

那么numpy有哪些功能呢?

首先在使用前要导入该模块(导入前要安装,方法自行搜索吧(*^-^*)),代码如下:

import numpy as np

1. 通过原有列表转化为数组

Numpy&Pandas的区别和联系

2.直接生成数组

  • 生成一维数组   
  • Numpy&Pandas的区别和联系 

 上图中由于生成一维数组时,没有给参数10 定义数据类型,所以数组元素的类型默认为float64。那定义数据类型为整型时会是什么结果呢?

Numpy&Pandas的区别和联系

  • 生成多维数组 

Numpy&Pandas的区别和联系

zeros返回来一个给定形状和类型的用0填充的数组,同理,ones返回来一个给定形状和类型的用1填充的数组。但更多情况下我们想指定某个值,这时用np.full(shape, val)生成全为val的值,如下:

 Numpy&Pandas的区别和联系

  • 随机数取值 

我们知道random库中可以通过random.randint(5,10)来随机生成一个5-10的数,如下:

Numpy&Pandas的区别和联系

在numpy中也有一个类似的加强版的功能。

Numpy&Pandas的区别和联系 

  • 范围取值  
  • Numpy&Pandas的区别和联系
  •  

    访问数组中的元素

Numpy&Pandas的区别和联系

Numpy&Pandas的区别和联系 

  •  基本数学运算

numpy在做运算时,是对数组中每个元素都进行运算。

Numpy&Pandas的区别和联系

 常用的运算符号及等价函数总结如下:

Numpy&Pandas的区别和联系

Numpy&Pandas的区别和联系 

  •  数组变形

Numpy&Pandas的区别和联系

 数组变形时,数组总大小保持不变,如上图中我们定义了一个两行五列的数组,总大小为2*5=10,经变形后得到一行十列的数组,总大小仍为10,但我们无法变成3*4或6*9等类型。

  • 数组拼接

Numpy&Pandas的区别和联系

  • 数组排序

Numpy&Pandas的区别和联系

二、Pandas

pandas是基于numpy数组构建的,但二者最大的不同是pandas是专门为处理表格和混杂数据设计的,比较契合统计分析中的表结构,而numpy更适合处理统一的数值数组数据。pandas数组结构有一维Series二维DataFrame

使用前同样需要先导入该模块,代码如下:

import pandas as pd

1. Series

Series是一种类似于一维数组的对象,它由一组数据以及一组与之相关的数据标签(索引index)组成。

Numpy&Pandas的区别和联系

 Series的字符串表现形式为:索引在左边,值在右边。如果不为数据指定索引,则会默认创建一个0到n-1的整数型索引。

Numpy&Pandas的区别和联系

  •  通过原有字典转化为数组

Numpy&Pandas的区别和联系

  •  访问元素

与numpy相比,除了根据位置获取值外,还可以根据索引获取。

Numpy&Pandas的区别和联系

 Numpy&Pandas的区别和联系

  •  向量化运算

Numpy&Pandas的区别和联系

上图运行结果可以看到出现了缺失值NaN(not a number),这是因为索引值b、c、d、e、f、g只出现在一个一维数组中。在数据分析过程中,我们通常不希望缺失值出现,那么如何解决呢?

一般常用的有两种方法:

Numpy&Pandas的区别和联系

 2. DataFrame

DataFrame是一个表格型的数据结构,其中的数据是以一个或多个二维块存放的,而不是列表、字典或别的一维数据结构。它含有一组有序的列,每列可以是不同的数据类型,它既有行索引,也有列索引。

  • 将原有字典转化为DataFrame

Numpy&Pandas的区别和联系

  •  访问元素

Numpy&Pandas的区别和联系

 Numpy&Pandas的区别和联系

 Numpy&Pandas的区别和联系

  •  条件筛选

Numpy&Pandas的区别和联系

  •   排序

 Numpy&Pandas的区别和联系

  •  应用函数

Numpy&Pandas的区别和联系

 Numpy&Pandas的区别和联系

 其他常用函数举例如下:

 

# 取前五行
table.head()

# 取后五行
table.tail()

# 查看行列数
table.shape()

# 查看每一列的统计信息
table.describe()

......

 以上就是numpy与pandas的基础内容,如有遗漏或错误,欢迎评论区指正~~文章来源地址https://www.toymoban.com/news/detail-401841.html

到了这里,关于Numpy&Pandas的区别和联系的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • NumPy 和 Pandas 数据分析实用指南:1~6 全

    原文:Hands-On Data Analysis with NumPy and pandas 协议:CC BY-NC-SA 4.0 译者:飞龙 在本章中,我们将介绍以下主题: 安装 Anaconda 探索 Jupyter 笔记本 探索 Jupyter 的替代品 管理 Anaconda 包 配置数据库 在本章中,我们将讨论如何安装和管理 Anaconda。 Anaconda 是一个包,我们将在本书的以下各

    2023年04月14日
    浏览(81)
  • 银行营销数据分析---Python(numpy、pandas、matplotlib)

    数据来源:kaggle银行营销数据 工具:Python、Jupyter Notebook 本项目采取的是kaggle银行营销的数据源,主要是预测客户是否会订购银行的产品,但是,这次我将 使用numpy、pandas、matplotlib数据分析三件套,基于源数据,深入分析影响银行三大业务—存款、贷款、营销产品的因素 ,

    2024年02月07日
    浏览(58)
  • 【numpy基础】--目录(完结)

    NumPy是一个开源的科学计算库,它提供了高效的数值计算和数组操作功能,主要包括: 多维数组的创建、操作和索引。 数组的切片、拼接和转置。 数组的乘法、除法、求导、积分、对数等基本运算。 数组的逐元素操作、求平均值、中位数、众数等统计量。 数组作为列表、元

    2024年02月12日
    浏览(35)
  • python-数据分析-numpy、pandas、matplotlib的常用方法

    输出方式不同 里面包含的元素类型 使用 索引/切片 访问ndarray元素 切片 左闭右开 np.array(list) np.arange() np.random.randn() - - - 服从标准正态分布- - - 数学期望 μ - - - 标准方差 s 使用matplotlib.pyplot模块验证标准正态分布 np.random.randint(起始数,终止数(行,列)) 数据分析 - - - 数据清洗

    2024年02月10日
    浏览(99)
  • python数据分析学习笔记之matplotlib、numpy、pandas

    为了学习机器学习,在此先学习以下数据分析的matplotlib,numpy,pandas,主要是为自己的学习做个记录,如有不会的可以随时查阅。希望大家可以一起学习共同进步,我们最终都可以说:功不唐捐,玉汝于成。就算遇到困难也不要气馁,大声说:我不怕,我敏而好学!! 把大量

    2024年02月08日
    浏览(59)
  • NumPy和Pandas库的基本用法,用于数据处理和分析

    当涉及到数据处理和分析时,NumPy和Pandas是两个非常常用的Python库。下面是它们的基本用法: NumPy(Numerical Python): 导入NumPy库:在代码中使用import numpy as np导入NumPy库。 创建NumPy数组:使用np.array()函数可以创建一个NumPy数组。例如,arr = np.array([1, 2, 3, 4, 5])创建一个包含整数

    2024年02月11日
    浏览(43)
  • Python数据分析:NumPy、Pandas和Matplotlib的使用和实践

    在现代数据分析领域中,Python已成为最受欢迎的编程语言之一。Python通过庞大的社区和出色的库支持,成为了数据科学家和分析师的首选语言。在Python的库中,NumPy、Pandas和Matplotlib是三个最为重要的库,它们分别用于处理数值数组、数据处理和可视化。本文将介绍这三个库的

    2024年02月04日
    浏览(70)
  • 郭炜老师mooc第十一章数据分析和展示(numpy,pandas, matplotlib)

    numpy创建数组的常用函数  numpy数组常用属性和函数  numpy数组元素的增删 在numpy数组中查找元素  np.argwhere( a ):返回非0的数组元组的索引,其中a是要索引数组的条件。 np.where(condition) 当where内只有一个参数时,那个参数表示条件,当条件成立时,           where返回的是每个

    2024年03月15日
    浏览(80)
  • 【python】numpy的array数组与pandas的DataFrame表格互相转换(图文代码超详细)

    目录 0.环境 1.array数组和DataFrame表格的简单介绍 2.转换方式详解(代码) 0)前提:【需注意】 1)array转化为DataFrame 2)DataFrame转化为array  3)完整代码 windows + jupyter notebook测试代码 + python语言 首先我们要知道, array 类型的数组是来自于 numpy 库, 而 DataFrame 类型的表格是来自

    2024年02月11日
    浏览(36)
  • python处理Excel Pandas xlwings numpy, jupyter,docx,jieba 词频统计 flash

    顺序不变,是可以的 如果李四和王五两行换一下,就不对了, 结果 pandas的nlargest(n,“排序的列”),只能求最大N个值 同比 df[‘昨日’] = df[“销售金额”].shift() shift() 会把销售金额放入昨日 python 在网页上显示Excel Excel 修改数据,网页只有刷新就可以了。 python 制作网页查询

    2024年02月10日
    浏览(50)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包