数据分析03——矩阵常用计算方法和函数

1年前作者：疋瓞分类：Toy博客阅读(6)违法举报

这篇具有很好参考价值的文章主要介绍了数据分析03——矩阵常用计算方法和函数。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

0、前言：

数组：计算机领域的概念
矩阵：数学领域的概念
对于Numpy而言，矩阵是数组的分支

1、创建矩阵：

字符串创建矩阵：mat1 = np.matrix(‘1 2;3 4’)
列表形式创建矩阵：mat2 = np.matrix([[5, 6], [7, 8]])
通过数组创建矩阵：
arr = np.array([[5, 6], [7, 8]])
mat3 = np.matrix(arr)
创建3*3的0矩阵： np.matrix(np.zeros((3, 3)))
创建3*3的1矩阵：np.matrix(np.ones([2, 4]))
创建3*3的矩阵，数值范围为[0,1)的小数：np.matrix(np.random.rand(3, 3))
创建3*5的矩阵，数值范围为[1,8)的整数：np.matrix(np.random.randint(1, 8, size=(3, 5)))
创建4*4的对角矩阵，对角线元素为1，其他元素为0，即单位矩阵：np.matrix(np.eye(4, 4, dtype=int))
创建3*3的对角矩阵，对角线元素为[1, 2, 3]：np.matrix(np.diag([1, 2, 3]))

2、矩阵运算1：

数组四则运算原理：广播机制

上图中，两个数组可以进行四则运算的前提要么是两个数组形状相同，要么就符合上面的广播机制。
同理，矩阵的（加法、减法、除法）运算也可以应用传播机制
矩阵乘法运算要求：第1个矩阵的列数必须等于第2个矩阵的行数
两个二维（通过”数组名.ndim“查看维数，一般有几个中括号就是几维）数组的点乘运算等价于矩阵乘法运算：np.dot(m3, m4)

3、矩阵重塑：

矩阵转置：mat.T
reshape矩阵重塑
重塑前后的元素个数必须一致
重塑后不会修改原矩阵
resize矩阵重塑
重塑前后的元素个数可以不一致：重塑后比原尺寸小，自动截断。重塑后比原尺寸大，以0填充。
重塑后会修改原矩阵

4、数学运算函数：

以下举例假设新建了n1和n2和n3数组
通过函数进行数学运算
符号运算和函数运算均采用广播机制，以下介绍函数运算
判断数组是几维的：数组名.ndim
加法运算：np.add(n1, n2)
减法运算：np.subtract(n1, n2)
乘法运算：np.multiply(n1, n2)
除法运算：np.divide(n1, n2)
幂运算：np.power(n1, n2) # 以n1中元素为底数，n2对应位置元素为指数。
取整（相除后取整数部分）：np.floor_divide(n1, n2)
取余/取模（相除后取余数部分）：np.mod(n1, n2)
求相反数：np.negative(n1)
求倒数：np.reciprocal(n1.astype(float)) # 换成浮点型的原因是为了求出来有小数
四舍五入保留两位小数：np.around(n2, decimals=2)
四舍五入取整到小数点左侧一位：np.around(n3, decimals=-1)
向上取整：np.ceil(n3)
向下取整：np.floor(n3)
元素累加、元素累乘
指数运算、对数运算

5、统计分析函数：

对数组求和：数组名.sum()
每列的行元素求和：数组名.sum(axis=0)
每行的列元素求和：数组名.sum(axis=1)
对数组求平均值：数组名.mean()
按照行求平均值：数组名.mean(axis=0)
按照列求平均值：数组名.mean(axis=1)
求数组最大值：arr.max()
按照行求最大值：arr.max(axis=0)
按照列求最大值：arr.max(axis=1)
加权平均值：
按数量number占比来计算加权单价price
加权平均数的好处消除极端值的影响
np.average(price, weights=number)
中位数：np.median(数组名)
方差：np.var(数组名)
标准差：np.std(数组名)

6、数组排序

把每一列中所有行进行排序：np.sort(n, axis=0)
把每一列中所有行进行降序：
先升序再反转
asc = np.sort(n, axis=0)
np.flip(asc, axis=0)
把每一行中所有列进行升序：np.sort(n, axis=1)

文章来源地址https://www.toymoban.com/news/detail-726467.html

到了这里，关于数据分析03——矩阵常用计算方法和函数的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

【Python数据分析】Python常用内置函数（二）
🎉欢迎来到Python专栏~Python常用内置函数（二） ☆* o(≧▽≦)o *☆ 嗨 ~我是小夏与酒 🍹 ✨ 博客主页：小夏与酒的博客 🎈该系列文章专栏： Python学习专栏文章作者技术和水平有限，如果文中出现错误，希望大家能指正🙏 📜 欢迎大家关注！ ❤️ Python技能树：Python入门技
2024年02月14日
浏览(7)
【业务数据分析】——十大常用数据分析方法
🤵‍♂️ 个人主页：@Lingxw_w的个人主页 ✍🏻作者简介：计算机科学与技术研究生在读 🐋 希望大家多多支持，我们一起进步！😄 如果文章对你有帮助的话，欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 目录一、数据分析方法二、营销管理方法论 1、SWOT分析 2、PEST分析 3、
2023年04月22日
浏览(7)
数据分析、数据挖掘常用的数据清洗方法
数据的完整性—例如：人的属性中缺少性别数据的唯一性—例如：不同来源的数据出现重复数据的权威性—例如：同一个指标出现多个来源的数据且数值不同数据的合法性—例如：获取的数据与常识不符，年龄大于200岁数据的一致性—例如：不同来源的不同指标，实际内涵
2024年02月08日
浏览(16)
数据分析中常用的指标或方法
总体方差 V a r ( x ) = σ 2 = ∑ i = 1 n ( x i − x ˉ ) 2 n = ∑ i = 1 n x i 2 − n x ˉ 2 n = E ( x 2 ) − [ E ( x ) ] 2 Var(x)=sigma^2=frac {sumlimits_{i=1}^{n} (x_i - bar{x})^2} {n} =frac{sumlimits_{i=1}^nx_i^2-nbar{x}^2} {n} =E(x^2)-[E(x)]^2 Va r ( x ) = σ 2 = n i = 1 ∑ n ( x i − x ˉ ) 2 = n i = 1 ∑ n x i 2 −
2024年01月17日
浏览(11)
python-数据分析-numpy、pandas、matplotlib的常用方法
输出方式不同里面包含的元素类型使用索引/切片访问ndarray元素切片左闭右开 np.array(list) np.arange() np.random.randn() - - - 服从标准正态分布- - - 数学期望 μ - - - 标准方差 s 使用matplotlib.pyplot模块验证标准正态分布 np.random.randint(起始数，终止数(行，列)) 数据分析 - - - 数据清洗
2024年02月10日
浏览(56)
大数据的常用算法（分类、回归分析、聚类、关联规则、神经网络方法、web数据挖掘）
在大数据时代，数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程，也是一种决策支持过程。其主要基于人工智能，机器学习，模式学习，统计学等。通过对大数据
2024年02月09日
浏览(10)
【海量数据挖掘/数据分析】之决策树模型（决策树模型、决策树构成、决策树常用算法、决策树性能要求、信息增益、信息增益计算公式、决策树信息增益计算实例）
目录【海量数据挖掘/数据分析】之决策树模型（决策树模型、决策树构成、决策树常用算法、决策树性能要求、信息增益、信息增益计算公式、决策树信息增益计算实例）一、决策树模型 1、常用算法 2、属性划分策略 3、其他算法三、决策树算法性能要求四、决策树模型
2024年02月13日
浏览(9)
【生物信息学】单细胞RNA测序数据分析：计算亲和力矩阵（基于距离、皮尔逊相关系数）及绘制热图（Heatmap）
计算亲和力矩阵，一般按照以下步骤进行：导入数据：加载单细胞RNA测序数据集。数据预处理：根据需要对数据进行预处理，例如基因过滤、归一化等。计算亲和力：使用合适的算法（例如，欧几里德距离、 Pearson相关系数或其他距离/相似度度量）计算样本之间的
2024年02月06日
浏览(9)
讲课笔记03：数据分析工具Pandas
2023年06月26日
浏览(6)
机器学习03-数据理解(小白快速理解分析Pima Indians数据集)
机器学习数据理解是指对数据集进行详细的分析和探索，以了解数据的结构、特征、分布和质量。数据理解是进行机器学习项目的重要第一步，它有助于我们对数据的基本属性有全面的了解，并为后续的数据预处理、特征工程和模型选择提供指导。数据理解的主要目标包括但
2024年02月14日
浏览(13)