【numpy基础】--数组过滤

这篇具有很好参考价值的文章主要介绍了【numpy基础】--数组过滤。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

numpy中,数组可以看作是一系列数值的有序集合,可以通过下标访问其中的元素。
处理数组的过程中,经常需要用到数组过滤功能。

过滤功能可以在处理数据时非常有用,因为它可以使数据更加干净和可读性更强。
例如,在进行数据分析时,通常需要去除异常值,过滤掉不必要的元素可以使数据更加易于分析和处理。

numpy本身提供了很多针对特定要求的过滤函数,
不过本篇只介绍最基本的过滤方式,通过最基本的过滤方式来揭示其过滤的原理。

1. 比较

比较是过滤的前提,因为通过比较才能确定过滤的条件。

1.1. 数组和单个数字

import numpy as np

arr = np.random.randint(0, 10, (3, 3))
print(arr)
#运行结果
[[4 1 4]
 [7 6 1]
 [8 9 5]]

print(arr > 5)
#运行结果
[[False False False]
 [ True  True False]
 [ True  True False]]

数组和单个数字比较,也满足上一篇介绍的广播原则,也就是数组arr的每个元素都和数字5进行了比较。

比较的结果是和arr相同结构的数组,数组中的元素是bool值。
满足比较条件是True不满足比较条件的是False

1.2. 数组和数组

除了和单个数字比较之外,数组之间也是可以比较的。

arr1 = np.random.randint(0, 10, (3, 3))
print(arr1)
#运行结果
[[9 7 3]
 [2 8 5]
 [2 2 3]]

arr2 = np.random.randint(0, 10, (3, 3))
print(arr2)
#运行结果
[[1 6 0]
 [0 1 8]
 [9 0 5]]

print(arr1 > arr2)
#运行结果
[[ True  True  True]
 [ True  True False]
 [False  True False]]

数组之间的比较就是相同位置的元素之间比较,如果两个数组的结构不一样,会按照上一篇介绍的广播计算方式来扩充数组。
比如:

arr1 = np.random.randint(0, 10, (3, 3))
print(arr1)
#运行结果
[[9 6 0]
 [1 4 9]
 [1 1 4]]

arr2 = np.random.randint(0, 10, (3, 1))
print(arr2)
#运行结果
[[1]
 [0]
 [9]]

print(arr1 > arr2)
#运行结果
[[ True  True False]
 [ True  True  True]
 [False False False]]

上面的数组arr2,按广播规则被扩充成:

[[1 1 1]
[0 0 0]
[9 9 9]]

2. 掩码

所谓掩码,其实就是上面的各个示例中的比较结果。
也就是只包含bool值的数组,比如:

[[ True True False]
[ True True True]
[False False False]]

我们就是根据这个掩码,来过滤出数组中的True 或者 False 位置的元素。

3. 过滤

过滤就是根据掩码,选择出符合条件的元素。

3.1. 单条件过滤

arr = np.random.randint(0, 10, (3, 3))
print(arr)
#运行结果
[[8 4 0]
 [2 2 9]
 [9 5 9]]

print(arr[arr > 5])
#运行结果
[8 9 9 9]

最后得到的是arr中值大于5的元素数组。
其中 arr > 5 的结果就是上一节提到的掩码,最后过滤出的元素就是根据这个掩码得到的。

除了跟单独的数字比较,也可以和数组比较:

arr1 = np.random.randint(0, 10, (3, 3))
print(arr1)
#运行结果
[[3 4 7]
 [4 6 2]
 [7 2 1]]

arr2 = np.random.randint(0, 10, (3, 3))
print(arr2)
#运行结果
[[2 3 1]
 [7 7 7]
 [1 6 4]]

print(arr1[arr1 > arr2])
#运行结果
[3 4 7 7]

3.2. 多条件过滤

多条件过滤使用 &| 来连接不同的条件。

arr1 = np.random.randint(0, 10, (3, 3))
print(arr1)
#运行结果
[[1 0 5]
 [7 4 9]
 [8 5 4]]

arr2 = np.random.randint(0, 10, (3, 3))
print(arr2)
#运行结果
[[6 4 1]
 [0 1 1]
 [8 5 8]]

print(arr1[(arr1 > 5) & (arr1 > arr2)])
#运行结果
[7 9]

过滤arr1大于5** 并且 **对应位置比arr2大的元素。

arr1 = np.random.randint(0, 10, (3, 3))
print(arr1)
#运行结果
[[1 0 5]
 [7 4 9]
 [8 5 4]]

arr2 = np.random.randint(0, 10, (3, 3))
print(arr2)
#运行结果
[[6 4 1]
 [0 1 1]
 [8 5 8]]

print(arr1[(arr1 > 5) | (arr1 > arr2)])
#运行结果
[5 7 4 9 8]

过滤arr1大于5** 或者 **对应位置比arr2大的元素。

4. 总结回顾

本篇主要介绍了过滤的基本原理,首先从比较开始,比较的结果是掩码,最后通过掩码过滤数组。文章来源地址https://www.toymoban.com/news/detail-509128.html

到了这里,关于【numpy基础】--数组过滤的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Python Numpy入门基础(二)数组操作

    NumPy是Python中一个重要的数学运算库,它提供了了一组多维数组对象和一组用于操作这些数组的函数。以下是一些NumPy的主要特点: 多维数组对象:NumPy的核心是ndarray对象,它是一个多维数组对象,可以容纳任意数据类型。 矢量化操作:使用NumPy的函数,可以对整个数组进行

    2024年02月15日
    浏览(46)
  • 社科院与杜兰大学金融管理硕士项目—人生的每一条路都可以看作是正确的路

    成年人的世界里没有什么是容易的。生活中经常听到人说:早知道现在过得这么辛苦,当年真应该好好读书;早知道这个行业这么难出头,当年真不应该踏入这一行;早知道爱人这么不靠谱,当年不跟他结婚就好了……有时候生活陷入困局,并不是你赌错了人生的选择,而是

    2023年04月12日
    浏览(57)
  • 【Python 零基础入门】Numpy 常用函数 数组操作 & 数学运算

    Numpy (Numerical Python) 是 Python 编程语言的一个扩展程序库, 支持大量的维度数组与矩阵运算, 并提供了大量的数学函数库. Numpy 利用了多线程数组来存储和处理大型数据集, 从而提供了一个高效的方式来进行数值计算, 特别是对于矩阵预算和线性代数. np.assarray 可以将输入转换为

    2024年02月05日
    浏览(49)
  • 【科大讯飞星火】如果说数据结构统治着整个计算机程序的世界,那么算法就可以被看作是程序员的全部装备。一般的来看的话,计算机本质就是信息的存储和处理的技术

    计算机科学是研究计算机及其相关技术的学科。它涵盖了多个领域,包括算法、数据结构、编程语言、操作系统、计算机网络等。本章将介绍计算机科学的基本概念和原理。 计算机硬件是指计算机的物理部分,包括中央处理器(CPU)、内存、硬盘、显示器、键盘等。其中,CPU

    2024年02月08日
    浏览(66)
  • Numpy-改变数组维度_数组的拼接

    处理数组的一项重要工 作就是改变数组的维度,包含提高数组的维度和降低数组的维度,还包括数组的转置Numpy 提供的大量API可以很轻松地完成这些数组的操作。 例如,通过 reshape 方法可以将一维数组变成二维、三维或者多维数组。 通过 ravel 方法或 flatten 方法可以将多维数

    2024年02月15日
    浏览(43)
  • Numpy 数组切片

    1.1、切片原理 列表切片是从原始列表中提取列表的一部分的过程。在列表切片中,我们将根据所需内容(如,从何处开始,结束以及增量进行切片)剪切列表。Python中符合序列的有序序列都支持切片(slice),例如列表,字符串,元组。 规则: 1.2、切片使用 1.2.1、获取列表

    2023年04月19日
    浏览(48)
  • Numpy数组和矩阵

    1.numpy 主要用于高维的数组运算,拥有运算速度快的 数学库 ;Numpy 支持常见的数组和矩阵操作 。Numpy 使用ndarray对象来处理多维数组 ,该对象是一个快速而灵活的大数据容器。 安装 windows: 升级 pip: 安装 Numpy库:(Ubuntu一样) 下载完成后可以在Python文件中 来测试是否安装成

    2023年04月08日
    浏览(57)
  • 一文弄懂numpy数组

    前言 学习数据分析,必绕不开numpy和pandas这两个库,numpy的ndarray数据结构和矩阵数据非常类似,最近搞科研的时候总是会用到,之前学的都忘记完了,所以,这次打算把numpy库的基本用法记录在一篇文章里,以便后面复习和使用。 ndarray多维数组创建 不要管复杂的概念,我们

    2024年02月05日
    浏览(59)
  • NumPy数组基本用法

    Numpy是Python科学计算库,用于快速处理任意维度的数组。 NumPy提供一个N维数组类型ndarray,它描述了相同类型的“items”的集合。 numpy.ndarray支持向量化运算。 NumPy使用c语言写的,底部解除了GIL,其对数组的操作速度不在受python解释器限制。 python一个列表中可以存储多种数据类

    2024年02月09日
    浏览(45)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包