利用R语言进行主成分分析的步骤

这篇具有很好参考价值的文章主要介绍了利用R语言进行主成分分析的步骤。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

主成分分析原理:

  1. 数据标准化
  2. 计算相关系数(协方差)矩阵
  3. 求解特征值和相应的特征向量
  4. 计算主成分得分
  5. 绘制主成分散点图
  6. 根据主成分得分的数据,进行分析

首先,导入数据。

library(openxlsx)
data0 = read.xlsx('D:/duoyuan_data/mvexer5.xlsx','E8.4',rowNames=TRUE)
head(data0)

第一步,对数据进行预处理

A <- as.matrix(scale(data0))  #对原始数据进行处理
data <- round(A,4);data #保留四位小数

第二步,计算相关系数矩阵及特征值和特征向量

R <- cor(data);R  #相关系数矩阵
R.e <- eigen(R);R.e  #相关系数阵的特征根与特征向量

第三步,进行主成分分析

  • 确定主成分个数

#使用R自带的princomp包进行主成分分析,默认使用协方差阵求

pca <- princomp(data)
summary(pca)

由上述数据得出的结果可知,前n个主成分的累计方差贡献率为92.41%,大于80%,因此基本可以代表所有指标的信息量。

  • 求出因子载荷矩阵
B <- cor(data, pca$scores)
pca$loadings
options(digits = 4)#保留四位小数

然后根据因子载荷矩阵写出两个主成分分析的表达式以及主成分的含义。

其中主成分Comp.1在国内生产总值、一般预算收入、固定资产投资、外贸进出口、城市居民人均可支配收入的载荷值都很大,可视为总竞争力主成分反映了核心城市的总发展水平;而主成分Comp.2在人均国内生产总值及人均贷款余额上的载荷值很大,可视为人均竞争力主成分反映了核心城市的人均发展水平。文章来源地址https://www.toymoban.com/news/detail-465170.html

  • 计算主成分得分
pca$scores[,1:2]#只计算前两个主成分即可
options(digits = 4)#保留四位小数
  • 将主成分分析结果可视化
#主成分得分图
plot(PC$scores,asp=1);abline(h=0,v=0,lty=3)

#成分双重信息图
biplot(pca$scores,pca$loadings);abline(h = 0,v = 0,lty = 3)

#树状图
source('C:/Users/hhj/Documents/msaR.R',encoding = "utf-8")
PC = msa.pca(data0,cor = T);PC #在这里可以得到综合得分排名
plot(hclust(dist(scale(data0))))
  • 综合排名
PC$ranks

到了这里,关于利用R语言进行主成分分析的步骤的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • R语言主成分分析

    R语言主成分分析 之前介绍过怎么用SPSS进行主成分分析(PCA),已经忘了的朋友们可以 到主页看看 今天主要介绍下R语言主成分分析的几种方法。都是入门级别,跟着我一步步走,一点都不难哈~ 首先调用R语言自带的数据集,USArrests。这是个关于美国各州犯罪率的一个统计数据

    2024年02月11日
    浏览(33)
  • 数据分析案例-基于PCA主成分分析法对葡萄酒数据进行分析

    🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 目录 1.项目背景 2.项目简介 2.1分析目标 2.2数据集介绍 2.3技术工具 3.算法理论 4.实验过程

    2024年02月03日
    浏览(45)
  • PCA主成分分析教程(origin分析&绘制,无须R语言)

    相关性分析,相关的介绍内容大家自行搜索资料即可,这里不给大家过多阐述。 PCA作为常见的一种聚类分析方法,在很多SCI论文中均有出现,如下: 这里也不给大家解读了,总而言之就是为了说明蓝色组、红色组和蓝色组三组之间的差异性。 导入数据 这里给大家使用一组微

    2024年02月08日
    浏览(35)
  • R语言中主成分分析概念与操作(PCA)

    stats 默认加载包,提供 prcomp 与 princomp 函数进行PCA计算 psych 心理学研究包,提供 principal FactoMineR 多元分析包,提供 PCA 函数进行PCA计算 不同包中函数计算特征值并无差异,但由于对具体概念的理解不一致,导致同一参数的数值有一定区别,因此要对概念加以区分。 特征值

    2024年02月10日
    浏览(40)
  • R 语言 ggplot2 PCA 主成分分析(虚拟数据集)

    以上代码生成了100行基因,10列样本的矩阵 前五列命名 wt 开头+ 1-5 ,表示正常基因 后五列命名 ko 开头+ 1-5 ,表示缺少基因的样本(knock-out) 给每行基因都统一命名 gene + 1-100 head() 函数默认查看前6行 现在只是定义了矩阵的shape和name,还没填充数值 这段代码的作用是生成一个

    2024年02月11日
    浏览(46)
  • 【头歌】——数据分析与实践-基于Python语言的文件与文件夹管理-文本 文件处理-利用csv模块进行csv文件的读写操作

    第1关 创建子文件夹 第2关 删除带有只读属性的文件 第3关 批量复制文件夹中的所有文件 未通过本题,如果您通过了本题欢迎补充到评论区,有时间我会整理进来 第1关 读取宋词文件,根据词人建立多个文件 第2关 读取宋词文件,并根据词人建立多个文件夹 第3关 读取宋词文

    2024年01月25日
    浏览(73)
  • 【生态经济学】利用R语言进行经济学研究技术——从数据的收集与清洗、综合建模评价、数据的分析与可视化、因果推断等方面入手

    查看原文 如何快速掌握利用R语言进行经济学研究技术——从数据的收集与清洗、综合建模评价、数据的分析与可视化、因果推断等方面入手 近年来,人工智能领域已经取得突破性进展,对经济社会各个领域都产生了重大影响,结合了统计学、数据科学和计算机科学的机器学

    2024年02月12日
    浏览(56)
  • R语言——采用主成分分析PCA方法下的“S 模式 “矩阵从同步分类中提取度量指标

    本教程将向您展示如何根据我们的综合分类计算一些指标。 PCA(Principal Component Analysis,主成分分析)是一种常用的数据降维技术,用于从高维数据中提取最重要的特征。它通过将原始数据转换为一组新的正交变量,称为主成分,以捕捉数据中最大的方差。 1. 数据标准化:如

    2024年03月15日
    浏览(54)
  • 利用PaperPass进行AI辅写疑似度检测的七个步骤

    大家好,今天来聊聊利用神码论文进行AI辅写疑似度检测的七个步骤,希望能给大家提供一点参考。 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 标题:利用神码论文进行AI辅写疑似度检测的七个步骤 随着人工智能技术的不断进步

    2024年02月22日
    浏览(49)
  • 利用python进行回归分析

    通常大家会认为曲线拟合和回归分析类似,但其实回归分析中是包含曲线拟合的。拟合是研究因变量和自变量的函数关系的。而回归是研究随机变量间的相关关系的。拟合侧重于调整参数,使得与给出的数据相符合。而回归则是侧重于研究变量的关系,对拟合问题做统计分析

    2023年04月22日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包