数据分析03——矩阵常用计算方法和函数

这篇具有很好参考价值的文章主要介绍了数据分析03——矩阵常用计算方法和函数。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

0、前言:

  • 数组:计算机领域的概念
  • 矩阵:数学领域的概念
  • 对于Numpy而言,矩阵是数组的分支

1、创建矩阵:

  • 字符串创建矩阵:mat1 = np.matrix(‘1 2;3 4’)
  • 列表形式创建矩阵:mat2 = np.matrix([[5, 6], [7, 8]])
  • 通过数组创建矩阵:
    arr = np.array([[5, 6], [7, 8]])
    mat3 = np.matrix(arr)
  • 创建3*3的0矩阵: np.matrix(np.zeros((3, 3)))
  • 创建3*3的1矩阵:np.matrix(np.ones([2, 4]))
  • 创建3*3的矩阵,数值范围为[0,1)的小数:np.matrix(np.random.rand(3, 3))
  • 创建3*5的矩阵,数值范围为[1,8)的整数:np.matrix(np.random.randint(1, 8, size=(3, 5)))
  • 创建4*4的对角矩阵,对角线元素为1,其他元素为0,即单位矩阵:np.matrix(np.eye(4, 4, dtype=int))
  • 创建3*3的对角矩阵,对角线元素为[1, 2, 3]:np.matrix(np.diag([1, 2, 3]))

2、矩阵运算1:

  • 数组四则运算原理:广播机制
    数据分析03——矩阵常用计算方法和函数,数据分析,矩阵,数据分析,numpy
    上图中,两个数组可以进行四则运算的前提要么是两个数组形状相同,要么就符合上面的广播机制。
  • 同理,矩阵的(加法、减法、除法)运算也可以应用传播机制
  • 矩阵乘法运算要求:第1个矩阵的列数必须等于第2个矩阵的行数
  • 两个二维(通过”数组名.ndim“查看维数,一般有几个中括号就是几维)数组的点乘运算等价于矩阵乘法运算:np.dot(m3, m4)

3、矩阵重塑:

  • 矩阵转置:mat.T
  • reshape矩阵重塑
    重塑前后的元素个数必须一致
    重塑后不会修改原矩阵
  • resize矩阵重塑
    重塑前后的元素个数可以不一致:重塑后比原尺寸小,自动截断。重塑后比原尺寸大,以0填充。
    重塑后会修改原矩阵

4、数学运算函数:

  • 以下举例假设新建了n1和n2和n3数组
  • 通过函数进行数学运算
  • 符号运算和函数运算均采用广播机制,以下介绍函数运算
  • 判断数组是几维的:数组名.ndim
  • 加法运算:np.add(n1, n2)
  • 减法运算:np.subtract(n1, n2)
  • 乘法运算:np.multiply(n1, n2)
  • 除法运算:np.divide(n1, n2)
  • 幂运算:np.power(n1, n2) # 以n1中元素为底数,n2对应位置元素为指数。
  • 取整(相除后取整数部分):np.floor_divide(n1, n2)
  • 取余/取模(相除后取余数部分):np.mod(n1, n2)
  • 求相反数:np.negative(n1)
  • 求倒数:np.reciprocal(n1.astype(float)) # 换成浮点型的原因是为了求出来有小数
  • 四舍五入保留两位小数:np.around(n2, decimals=2)
  • 四舍五入取整到小数点左侧一位:np.around(n3, decimals=-1)
  • 向上取整:np.ceil(n3)
  • 向下取整:np.floor(n3)
  • 元素累加、元素累乘
  • 指数运算、对数运算

5、统计分析函数:

  • 对数组求和:数组名.sum()
  • 每列的行元素求和:数组名.sum(axis=0)
  • 每行的列元素求和:数组名.sum(axis=1)
  • 对数组求平均值:数组名.mean()
  • 按照行求平均值:数组名.mean(axis=0)
  • 按照列求平均值:数组名.mean(axis=1)
  • 求数组最大值:arr.max()
  • 按照行求最大值:arr.max(axis=0)
  • 按照列求最大值:arr.max(axis=1)
  • 加权平均值:
    按数量number占比来计算加权单价price
    加权平均数的好处消除极端值的影响
    np.average(price, weights=number)
  • 中位数:np.median(数组名)
  • 方差:np.var(数组名)
  • 标准差:np.std(数组名)

6、数组排序

  • 把每一列中所有行进行排序:np.sort(n, axis=0)
  • 把每一列中所有行进行降序:
    先升序再反转
    asc = np.sort(n, axis=0)
    np.flip(asc, axis=0)
  • 把每一行中所有列进行升序:np.sort(n, axis=1)

文章来源地址https://www.toymoban.com/news/detail-726467.html

到了这里,关于数据分析03——矩阵常用计算方法和函数的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【Python数据分析】Python常用内置函数(一)

    🎉欢迎来到Python专栏~Python常用内置函数(一) ☆* o(≧▽≦)o *☆ 嗨 ~我是 小夏与酒 🍹 ✨ 博客主页: 小夏与酒的博客 🎈该系列 文章专栏: Python学习专栏 文章作者技术和水平有限,如果文中出现错误,希望大家能指正🙏 📜 欢迎大家关注! ❤️ Python技能树:Python入门技

    2024年02月15日
    浏览(36)
  • 【业务数据分析】——十大常用数据分析方法

    🤵‍♂️ 个人主页:@Lingxw_w的个人主页 ✍🏻作者简介:计算机科学与技术研究生在读 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+  目录 一、数据分析方法 二、营销管理方法论 1、SWOT分析 2、PEST分析 3、

    2023年04月22日
    浏览(34)
  • 数据分析、数据挖掘常用的数据清洗方法

    数据的完整性—例如:人的属性中缺少性别 数据的唯一性—例如:不同来源的数据出现重复 数据的权威性—例如:同一个指标出现多个来源的数据且数值不同 数据的合法性—例如:获取的数据与常识不符,年龄大于200岁 数据的一致性—例如:不同来源的不同指标,实际内涵

    2024年02月08日
    浏览(46)
  • 数据分析中常用的指标或方法

    总体方差 V a r ( x ) = σ 2 = ∑ i = 1 n ( x i − x ˉ ) 2 n = ∑ i = 1 n x i 2 − n x ˉ 2 n = E ( x 2 ) − [ E ( x ) ] 2 Var(x)=sigma^2=frac {sumlimits_{i=1}^{n} (x_i - bar{x})^2} {n} =frac{sumlimits_{i=1}^nx_i^2-nbar{x}^2} {n} =E(x^2)-[E(x)]^2 Va r ( x ) = σ 2 = n i = 1 ∑ n ​ ( x i ​ − x ˉ ) 2 ​ = n i = 1 ∑ n ​ x i 2 ​ −

    2024年01月17日
    浏览(30)
  • python-数据分析-numpy、pandas、matplotlib的常用方法

    输出方式不同 里面包含的元素类型 使用 索引/切片 访问ndarray元素 切片 左闭右开 np.array(list) np.arange() np.random.randn() - - - 服从标准正态分布- - - 数学期望 μ - - - 标准方差 s 使用matplotlib.pyplot模块验证标准正态分布 np.random.randint(起始数,终止数(行,列)) 数据分析 - - - 数据清洗

    2024年02月10日
    浏览(38)
  • 大数据的常用算法(分类、回归分析、聚类、关联规则、神经网络方法、web数据挖掘)

    在大数据时代,数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程,也是一种决策支持过程。其主要基于人工智能,机器学习,模式学习,统计学等。通过对大数据

    2024年02月09日
    浏览(48)
  • 【海量数据挖掘/数据分析】之 决策树模型(决策树模型、决策树构成、决策树常用算法、决策树性能要求、信息增益、信息增益计算公式、决策树信息增益计算实例)

    目录 【海量数据挖掘/数据分析】之 决策树模型(决策树模型、决策树构成、决策树常用算法、决策树性能要求、信息增益、信息增益计算公式、决策树信息增益计算实例) 一、决策树模型 1、常用算法 2、属性划分策略 3、其他算法 三、决策树算法性能要求 四、 决策树模型

    2024年02月13日
    浏览(48)
  • 【生物信息学】单细胞RNA测序数据分析:计算亲和力矩阵(基于距离、皮尔逊相关系数)及绘制热图(Heatmap)

      计算亲和力矩阵,一般按照以下步骤进行: 导入数据:加载单细胞RNA测序数据集。 数据预处理:根据需要对数据进行预处理,例如 基因过滤 、 归一化 等。 计算亲和力:使用合适的算法(例如, 欧几里德距离 、 Pearson相关系数 或其他距离/相似度度量)计算样本之间的

    2024年02月06日
    浏览(32)
  • 讲课笔记03:数据分析工具Pandas

    2023年06月26日
    浏览(114)
  • 机器学习03-数据理解(小白快速理解分析Pima Indians数据集)

    机器学习数据理解是指对数据集进行详细的分析和探索,以了解数据的结构、特征、分布和质量。数据理解是进行机器学习项目的重要第一步,它有助于我们对数据的基本属性有全面的了解,并为后续的数据预处理、特征工程和模型选择提供指导。 数据理解的主要目标包括但

    2024年02月14日
    浏览(27)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包