主成分分析(PCA)实例讲解

这篇具有很好参考价值的文章主要介绍了主成分分析(PCA)实例讲解。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、什么是主成分分析?

    主成分分析(PCA)是一种降维算法,PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分(特征之间互相独立),是在原有n维特征的基础上重新构造出来的k维特征(k<=n),会带来部分信息损失。

二、主成分分析作用?

    一般来说,当研究的问题涉及到多变量且变量之间存在很强的相关性时,我们可考虑使用主成分分析的方法来对数据进行简化。

三、主成分分析原理推导

    可参考主成分分析原理推导和视频讲解

四、相关问题

1、什么是协方差矩阵?
    答:协方差矩阵表示的是两个变量在变化过程中是同向变化(值为正,正相关)还是反向变化(值为负,负相关),变化的程度是多少(值的大小,值为0表示不想关)。协方差公式如下:
主成分分析(PCA)实例讲解
    协方差矩阵如下:
主成分分析(PCA)实例讲解
    协方差矩阵示例:
主成分分析(PCA)实例讲解
    对数据进行标准化后,每一列数据的期望均为0,此时协方差矩阵可表示为:
主成分分析(PCA)实例讲解
2、协方差矩阵特征值为什么可以代表包含信息的多少?
    答:协方差矩阵的特征向量表示新坐标轴,特征值表示坐标轴方向的方差,而方差即表示了包含信息的多少。
3、PCA的本质是什么?
    答:PCA的本质其实就是在空间上寻找新的坐标系,使数据在新坐标系下能够尽可能的多保留信息。保留信息的多少用方差来表示,数据越分散,方差越大,信息越多,PCA的作用就是使原有数据在新坐标上方差最大,坐标轴1就是主成分1,坐标轴2就是主成分2,以此类推。
4、PCA的缺点?
    答:离群点对于降维结果影响很大

五、PCA公式推导

1、矩阵拉伸变换如下
主成分分析(PCA)实例讲解
    坐标向量表示如下:
主成分分析(PCA)实例讲解
    拉伸变换前后图像:
主成分分析(PCA)实例讲解
主成分分析(PCA)实例讲解
2、矩阵旋转变换如下
主成分分析(PCA)实例讲解
    坐标向量表示如下:
主成分分析(PCA)实例讲解
    旋转变换后图像:
主成分分析(PCA)实例讲解
3、公式推导
    结合第四节对协方差矩阵的描述内容,对公式进行推导如下:
主成分分析(PCA)实例讲解
    其协方差特征值意义如下:
主成分分析(PCA)实例讲解
4、求解过程如下
主成分分析(PCA)实例讲解

六、实例讲解

    取第三节中数据放入data.xlsx中如下:
主成分分析(PCA)实例讲解
    此数据共包含5列15行,即5个维度,先使用sklearn中的PCA模块进行降维,代码如下:

from sklearn.decomposition import PCA
from sklearn.preprocessing import scale
from sklearn.preprocessing import StandardScaler
import pandas as pd

path=r'E:\评分卡逻辑\PCA\data.xlsx'
df=pd.read_excel(path)
data=df.iloc[:,1:]

scale_data=scale(data)
StandardScaler_data=StandardScaler().fit_transform(data)

pca=PCA(n_components=5, copy=True, whiten=False)
pca.fit(scale_data)

newdata=pca.transform(scale_data)

print(pca.explained_variance_)#特征值,即方差
print(pca.explained_variance_ratio_)#占比
print(pca.components_)#特征值对应特征向量

    输出结果如下:
主成分分析(PCA)实例讲解文章来源地址https://www.toymoban.com/news/detail-490733.html

到了这里,关于主成分分析(PCA)实例讲解的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 主成分分析(PCA)步骤及代码

      主成分分析(Principal Component Analysis,PCA), 简称PCA,是一种统计方法。过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。主成分分析是我们在数学建模的过程中最为常见的线性降维方式,在比赛中常常会用在数据指标过多

    2023年04月08日
    浏览(40)
  • 主成分分析(PCA)——矩阵角度推导

    最近机器学习课上正式讲了主成分分析,只是老师说的很快,我并没有完全理解。随后我搜了很多关于这方面的讲解来进行理解,仅CSDN上就有很多讲的很好的文章,从协方差矩阵角度进行说明,基本上我也都理解了。但另一方面我发现可以结合我最近学的矩阵分析,从纯矩阵

    2024年03月15日
    浏览(35)
  • PCA主成成分分析例题详解

    主成分分析是一种降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息 需要了解具体细节可看此视频👉:什么是主成成分分析PCA 计算步骤 假设有 n n n 个样本, p p p 个特征,则可构

    2024年02月03日
    浏览(46)
  • 主成分分析(PCA)-Python代码

    主成分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。 算法的具体步骤如下: 1)对向量X进行去中心化。 2)计算向量X的协方差矩阵,自由度可以选择0或者1。 3)计算协方差矩阵的特征值和特征向量。 4)选取最大的k个特

    2024年02月14日
    浏览(36)
  • 【主成分分析(PCA)- 鸢尾花】

    在现代数据科学中,维度灾难常常是数据处理与分析的一大难题。主成分分析(PCA)是一种广泛使用的数据降维技术,它通过将原始数据转换为新的低维空间,保留最重要的信息,从而使得数据分析更加高效。本博客将详细介绍PCA的原理、应用场景以及如何使用Python中的skl

    2024年02月15日
    浏览(76)
  • 机器学习——主成成分分析PCA

    如上图所示,一共有4个属性,身高( m为单位),身高(cm),时速(每小时公里),时速(每小时里),身高的两个属性是相关的,时速的两个属性也是相关的,我们把四组具有相关性的变量转换成了两组不相关的变量,我们把转换后的这2组变量称为它的主成分。说白了,就

    2024年01月18日
    浏览(46)
  • 【数据处理方法】主成分分析(PCA)原理分析

            笔者最近在学习的过程需要使用一些数据分析和处理的方法,而PCA就是其中常用的一种手段。但在自学的过程中,由于笔者水平有限,对一些博客中的公式不是能很好理解(数学不好的辛酸Ծ‸Ծ),导致总是对整个方法的原理没有一个透彻的理解。后来在视频用

    2023年04月09日
    浏览(37)
  • sklearn中主成分分析PCA参数解释

    主成分分析一般用于数据降维,在应用主成分分析包scikit-learn时注意以下四点: 1、用pca.components_可以获取特征向量,且特征向量为 行向量 ,例如W = pca.components_[0, :] (或W = pca.components_[0])为第一特征向量,而W = pca.components_[1, :]表示第二特征向量。 2、采用特征向量对点云进

    2024年02月12日
    浏览(37)
  • 主成分分析(PCA)及python原理实现

    该定义来自于秒懂百科:          PCA(principal components analysis)即主成分分析技术,又称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。         在统计学中,主成分分析PCA是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换

    2024年02月07日
    浏览(43)
  • 主成分分析法(PCA)及其python实现

    主成分分析法(Principal Component Analysis,PCA)是一种用于把高维数据降成低维,使分析变得更加简便的分析方法。比如我们的一个样本可以由 n n n 维随机变量 ( X 1 , X 2 , . . . , X n ) (X_1,X_2,...,X_n) ( X 1 ​ , X 2 ​ , ... , X n ​ ) 来刻画,运用主成分分析法,我们可以把这些分量用更

    2024年01月16日
    浏览(45)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包