概述
典型相关分析(Canonical Correlation analysis)研究两组变量(每组变量中都可能有多个指标)之间相关关系的一种多元统计方法。 它能够揭示出两组变量之间的内在联系。
典型相关分析目的是识别并量化两组变量之间的联系,将两组变量相关关系的分析,转化为一组变量的线性组合与另一组变量线性组合之间的相关关系分析。
比如:研究人口统计变量(户主年龄、家庭年收入、户主受教育程度)与消费变量(每年去餐馆就餐的频率、每年出外看电影的频率)之间是否具有相关关系; 阅读能力变量(阅读速度、阅读才能)与数学运算能力变量(数学运算速度、数学运算才能)是否相关等。
涉及到多元统计的知识,工具:SPSS
基本理论
典型相关分析由Hotelling提出,其基本思想和主成分分析非常相似。
首先在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数; 然后选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对; 如此继续下去,直到两组变量之间的相关性被提取完毕为止。
被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。 典型相关系数度量了这两组变量之间联系的强度。
注:var:方差
样本典型相关分析
样本典型相关变量及典型相关系数的计算
在实际分析应用中,总体的协差阵通常是未知的,往往需要从研究的总体中随机抽取一个样本,根据样本估计出总体的协差阵,并在此基础上进行典型相关分析
典型相关系数的显著性检验
在利用样本进行两组变量的典型相关分析时,应就两组变量的相关性,即两组变量的协差阵是否为0进行检验
检验假设:
根据随机向量的检验理论可知,用于检验的似然比统计量为
巴特莱特提出了一个根据样本数据检验总体典型相关系数是否为0的方法
检验假设:
用于检验的似然比统计量为:
典型相关分析应用中的几个问题
一、从相关矩阵出发计算典型相关
典型相关分析涉及多个变量,不同的变量往往具有不同的量纲及不同的数量级别。在进行典型相关分析时,由于典型变量是原始变量的线性组合,具有不同量纲变量的线性组合显然失去了实际意义。其次,不同的数量级别会导致“以大吃小”,即数量级别小的变量的影响会被忽略,从而影响了分析结果的合理性。因此,为了消除量纲和数量级别的影响,必须对数据先做标准化变换处理,然后再做典型相关分析。显然,经标准化变换之后的协差阵就是相关系数矩阵,因而,也即通常应从相关矩阵出发进行典型相关分析。
二、典型载荷分析
进行典型载荷分析有助于更好解释分析已提取的p对典型变量,所谓典型载荷分析是指原始变量与典型变量之间的相关性分析
三、典型冗余分析
典型相关分析关键步骤
(1)数据的分布有假设:两组数据服从联合正态分布。
(2)首先要对两组变量的相关性进行检验(构造似然比统计量 )。
p值小于0.05(0.1)表示在95%(90%)的置信水平下拒绝原假设,即认为两组变量有关。
(3)确定典型相关变量的个数(直接看典型相关系数对应的P值即可)
(4)利用标准化后的典型相关变量分析问题
(5)进行典型载荷分析
(6)计算前 r个典型变量对样本总方差的贡献
SPSS操作步骤
注意:Spss至少需要24版本,低版本不能直接进行典型相关分析的操作,需要
编程。(如果新版本仍不能运行,则检查电脑用户名是否为中文,如果是中文
的话就需要在电脑上新建一个用户,在新用户上面重新安装SPSS)
第一步:导入数据
第二步:检验数据的类型
第三步:点击菜单功能
第四步:将数据移动到对应的集合
第五步:导出分析结果
第六步:对结果进行分析
首先看这张表格的最后一列,这一列代表着检验统计量所对应的p值,我们要通过它确定典型相关系数的个数
典型变量每个分量前面的系数代表着重要程度,可结合典型相关系数进行分析。文章来源:https://www.toymoban.com/news/detail-827851.html
文章来源地址https://www.toymoban.com/news/detail-827851.html
到了这里,关于典型相关分析——数学建模清风笔记的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!