Loading...
墨滴

精益修身

2021/04/10  阅读:49  主题:嫩青

SEM学习笔记之一

SEM学习笔记之一

精益修身

1. SEM的基本逻辑

SEM的基本思想就是根据协方差阵来求解模型的参数

基本式是:

Example:

例子中意味着:

一定成立。

回归分析、联立方程、CFA、典型相关分析(Canonical correlation)、面板数据分析、方差分析、协方差分析、多指标模型都是SEM的特例。

2. 模型符号,协方差和路径分析

2.1 模型符号

SEM包含有随机变量,结构参数,有时还包括非随机变量。三种随机变量包括:潜变量、可观测变量(observed variables)和扰动项。非随机变量是在重复抽样过程中保持不变的解释变量(固定的或者nonstochasitic),这些并不常见。结构参数把变量连接了起来,根据结构参数连接的变量不同,可以把模型分为潜变量模型(latent variable model)和测量模型(measurement model)。

2.1.1 潜变量模型

2.1.1.1 定义

潜变量(latent random variables)有时被会称为 不可测(unmeasured)变量,或者不可观察(unobserved)变量,或者因子(factors) 可观测模型或者潜变量的indicators包含有随机的或者系统的测量误差,但是潜变量没有测量误差。 智慧、阶级、权力和预期都是高度抽象的潜变量,他们不可测量,因而也不存在测量误差。

Emile Durkheim的研究中假定社会团结和自杀之间存在负相关。社会团结就是高度抽象的潜变量。

潜变量模型包含描述潜变量关系的结构方程,因此潜变量模型也叫做结构方程或者因果模型。但是潜变量模型的名称更为合适,因为测量模型中的方程也可以描述结构关系。

2.1.1.2 Notation

模型中外生的潜变量用 表示,内生的潜变量用 表示。模型不能解释的部分用 表示。例如:

其中 表示的是在 不变的情况下, 增加一个单位, 的期望增加值。 的解释类似。 系数与内生潜变量相联系, 与外生潜变量相联系。 方程组2.1可以写成矩阵形式。

可以简化为:

其中: ,且 与外生变量 不相关。同时假定 是同方差的和非自相关的。即

同方差和无自相关的假定,并不意味着不同方程的扰动项必须同方差和无自相关,只是在自己的方程内各观测值之间如此。

矩阵 是外生变量 的协方差矩阵,size是n n。如果 的方差为1,矩阵 就是相关矩阵。矩阵 是误差项的协方差阵,主对角线是方差,非主对角线是协方差,size是m m。内生变量 的协方差阵无需单独用符号表示,因为它无非是 的方程。

2.1 潜变量模型的Notation
2.1 潜变量模型的Notation
2.1.1.3 SEM和联立方程的区别

两者的形式完全相同,只是表示符号有所不同,但不同的表示符号所代表的含义是差别很大的。

联立方程是 ,SEM可以化简为 ,其中 ,

联立方程假定 是潜变量 的完美测量。但是在SEM中,并没有这个要求。事实上,测量模型把潜变量( )和可测变量( )联系了起来。

2.1.2 测量模型

2.1.2.1 定义

可测(observed)变量也有一些不同的名字,如 显示(manifest)变量,观察(measures)变量,指示(indicators)变量

潜变量模型描述的关系,只有在得到潜变量的数据之后才能证实。一个策略是用单一的指示变量或者代理变量;另一个策略是用一组指示变量。通过对可测的指示变量进行分析,研究人员就可以检验潜变量之间的关系。

2.1.2.2 Notation

例如:工业化 用人均GNP( )、人均能源消费( )、产业工人占比( )来表示。

1960年( )和1965年( )的政治民主用专家评定的新闻自由度( 1960年, 1965年),政治反对的自由度( ),选举的公平性( ),选举立法的有效性(

代表着工业化 的三种测量, 是1960( )和1965( )的政治民主 的测量。所有的方程中都是显示变量取决于(depend on)潜变量。相反的情况(指示变量决定潜变量)在后面讨论。

系数 表示潜变量变化1个单位,观测变量期望变化的数量。这些系数是潜变量对可测变量的回归系数。为了能够解释系数,分析者一般会对潜变量的scale作出规定,要么是把潜变量的scale定为指示变量的1个单位,要么是把方差定为1.

是测量误差,期望为0,互不相关,且与 无关。否则,将会导致不一致的估计。在因子分析中, 叫做独特因子(unique factors),可以被分成特定(specific)和非特定(nonspecific)两个组成部分。我们假定 也是同方差和无自相关的。

2.6和2.7式可以简化为矩阵形式:

其中, 向量, 的指示变量的个数; 向量, 的指示变量的个数。 是参数矩阵, 的数量; 的数量。 是误差向量。

矩阵 是测量误差的协方差阵。 的, 的。矩阵 应该是对角阵,因为2.8式中的测量误差互补相关。但是矩阵 则不然,1960年和1965年测定的是同一个个体,所以这两个年份的测量误差很可能是正相关的。因此, 中非对角元素很可能不为0。

测量模型的Notation
测量模型的Notation

2.2 协方差

协方差是结构方程的核心概念。

2.2.1 协方差代数

总体协方差用 表示,总体方差用 表示,总体协方差阵用 表示。

例子1:假定你知道 ,如果你加一个常数给x1,协方差不变。

例子2:两个指示变量都与潜变量正相关,则这两个指示变量也会正相关。

前提:

可以得出:

从中可以看出,如果 大于0,则 一定大于0。

但如果是 ,即使 的符号也不再必然是正的。

2.2.2 样本协方差

样本协方差的无偏估计量是

样本协方差矩阵为

样本协方差矩阵S是对称矩阵,对角线是样本方差,非对角线是样本协方差。

影响样本协方差矩阵S和总体协方差 接近的因素有二:其一是变量之间存在非线性因素;其二是离群点。非线性因素可以通过画散点图、回归方法等方法来确认。离群点可以用 来确认。矩阵A对角线元素 有如下特征

1、 ,接近0,表示观测值接近均值,接近1,表示观测值越远离均值;

2、

3、Average of

4、如果 表示接近1,如果 表示接近0。

离群点对估计的影响并不明确,有可能增加协方差,也有可能减少,也有可能不存在影响。如果存在离群点,需要查看包含和不包含两种情况的结果,加以对比。

2.3 路径分析

2.3.1 路径图

路径图是联立方程系统的图形表示。形如 路径图的例子

2.3.2 协方差的分解

使用协方差代数来进行分解,例如上图中 的协方差可以表示为:

其中, 的协方差矩阵。用矩阵来表示的话,形如:

由上可知,协方差矩阵 可以分解为 三个元素构成的等式。这个等式表明参数和协方差是相关联的,不同的参数值会导致不同的协方差。

2.3.3 总效应,直接效应和间接效应

举例

例子 直接效应 的直接效应是 的直接效应是

间接效应 的间接效应是

总效应 的总效应是 的总效应是

2.3.4 几个错误的认识

1、路径分析只能针对单向的因果关系;

2、路径分析只能应对标准化的回归系数;

3、路径分析不能处理非线性关系;

4、一个好的SEM模型意味着因果关系。事实上,好的SEM模型仅仅可能是有效的,因为别的模型和假定可能同样fit the data.

参考文献

  1. Bollen, Kenneth A. Structural Equations with latent variables[M] Wiley, Canada, 1989.

精益修身

2021/04/10  阅读:49  主题:嫩青

作者介绍

精益修身