精益修身
2021/05/16阅读:217主题:橙心
典型相关分析
Stata之典型相关分析
典型相关分析(canonical correlation analysis)是讨论两组变量之间相关性的分析方法,是简单相关和多元相关的延伸。
1. 原理
1.1 相关关系的类型
-
简单相关
简单相关是两个变量间的相关。
-
多变量相关分析
多元相关是一个变量和多个变量之间的相关,及复相关系数 ,它是线性回归中拟合优度 的平方根。
-
典型相关分析
典型相关讨论的是多个变量和多个变量之间的相关关系
1.2 典型相关的求解
存在两个随机向量
不失一般性,设$p
为了研究两组变量之间的关系,我们考虑他们的线性组和:
我们的目标是在 给定的情况下,找到合适的 使得 之间的相关系数最大:
由于 乘以任意常数,不改变他们的相关关系,不妨设定 ,使得 的方差为1:
所以
于是,我们可以用拉格朗日乘数法来求解 :
分别对 求偏导得方程组:
整理上式,并分别用
又因为
(2)式有非零解的充要条件是
由于
而
如果记
则
类似从(4)式中也可得
而
则
1.3 性质
-
每一对典型变量
-
任意两个典型变量
-
同一对典型变量
用数学公式来表达就是:
1.4 显著性检验
如果向量
都变为0。
这样显著性问题就变成如下检验:
如果前
检验统计量:
2. Stata实例
实例为何晓群第8章例2,讨论经济发展和空气质量的相关关系 代码如下:
import delimited "D:\齐安静 教学\统计学\多元统计分析\例题数据及程序整理\例8-2.csv", clear encoding(GB18030)
label variable y1 "pm2.5"
label variable y2 "pm10"
label variable y3 "so2"
label variable y4 "co"
label variable y5 "no2"
label variable y6 "o3"
label variable x1 "地区生成总值"
label variable x2 "第二产业增加值"
label variable x3 "第三产业增加值"
label variable x4 "人均地区生成总值"
label variable x5 "生产总值增长率"
label variable x6 "固定资产"
canon (x1-x6) (y1-y6), test(1 2 3)
predict air_qual, v correlation(1) //预测第2组变量的第一典型变量
predict eco_grow, u correlation(1) //预测第1组变量的第一典型变量
estat correlations //查看原始变量的相关系数
corr x1-x6 air eco //查看第一典型变量和经济发展的关系
corr y1-y6 air eco //查看第一典型变量和空气质量的关系
结果展示:

从图中结果可见,两组变量的第一典型变量之间的相关系数是显著的,但是其他组典型相关变量之间的相关系数不显著。

从上图可以看出,经济层面的第一典型变量
从
参考文献
-
何晓群. 多元统计分析[M]. 5版. 北京:中国人民大学出版社,2019. -
王斌会. 中国大学MOOC:多元统计分析及R语言建模[OL]. [2021-5-13]https://www.icourse163.org/course/JNU-1002335007 -
StataCorp LLC, Sturctural Equation Modeling Reference Manual[M]. A Stata Press Publication: Texas 2019.
分类:
后端标签:
后端作者介绍