Loading...
墨滴

精益修身

2021/06/25  阅读:84  主题:橙心

结构方程模型之四

SEM学习笔记之四

精益修身

1. 结构方程模型简介

1.1 潜变量(latent variable)

  1. 测量一个潜变量需要多少个指标变量? Bagozzi & Baumgartner(1994)建议3-5个。 Kenny(1979):两个也行,三个更好,四个最好,再多就画蛇添足了。 易丹辉(2008):如果一个潜变量的含义很清晰:也可以只用2个甚至是1个指标就能很好地反映其含义了。
  2. 指标变量的选择
    • 具有良好的信度和效度
    • 尽可能全面地测量潜变量的内涵,又不能产生多余的维度(测量身体健康的不能用于从测量心理健康)
    • 不同的指标之间最好是中度相关,既不能无关,又不能是高度相关,这样会出现共线的问题。

1.2 变量的分类

  1. 连续性变量和分类型变量

    • 社会科学中分类型变量较多,如果变量取值超过5个,可以认为是连续型变量进行处理。连续性变量一般假设服从正态分布,使用线性模型进行估计。
    • 分类型变量往往假设服从0/1分布,二项分布,多项式分布,泊松分布,负二项分布等,使用非线性模型估计。
  2. 潜变量也可以分为分类和连续两种形式。

    • 邱皓政(2008):连续性潜变量可采用因子分析(factor analysis, FA)和潜特质分析(latent trait analysis, LTA)两种测量方式。
    • 分类型潜变量:可采用连续型测量指标的潜剖面分析(latent profile analysis, LPA)和分类型测量指标的潜类别分析(latent class analysis, LCA)。
  3. 变量中心化(variable-centered)研究变量的取值变化及其分布规律,分析对象聚焦变量。

  4. 个体中心化(personal centered)研究个体差异及分类。

  5. 内生变量和外生变量 内生:模型决定的变量。所有的内生变量都是连续性变量时,用SEM估计。有一个内生变量不是连续型,需要使用GSEM来估计。 外生:不由系统决定的变量。

    • 只发不收:外生
    • 只收不发:结果
    • 又收又发:中介

2. 什么是结构方程模型?

2.1 结构方程模型的基础模块

  1. Long(2014):回归分析是结构方程模型的一些特例,是结构方程模型最简单的形式。
  2. 如果结构方程模型只研究相关,不考虑因果,即不考虑结构模型部分,结构方程模型就是验证性因子分析模型(CFA)。
  3. 结构方程模型中,路径分析是用来描述、刻画潜变量之间结构关系的,是整个模型的结构模型部分。路径分析其实就是使用多元显变量的结构方程模型。

2.2 定义

  1. 结构方程模型是一种用测量模型(measurement model)构造潜变量,结构模型(structural model)反映潜变量之间关系路径的一整套模型,用之来估计、检验潜变量之间的关系的多元统计方法。它不仅能处理潜变量,也能处理显变量及潜显混合变量,所以是一个一般性的模型框架。
  2. 因子分析方法构造潜变量的测量模型
    • 侯杰泰、温忠麟和成子娟(2004)认为标准化的因子载荷系数应该在0.6以上,小于0.5时,这个测量指标就需要慎重考虑。Nunnally 和 Bernstein(1994)则认为最低极限是0.3。
    • 聚合效度(convergent validity)是测量同一个潜变量的各指标之间要有相对高的载荷系数(>0.7)。区分效度(discriminant validity)各潜变量因子之间的相关系数不能太高(<0.9)。简言之,各个指标要能聚拢在一起测量同一个因子,而不同因子的指标之间又要有区分度。
  3. 搭建结构模型
    • 结构模型要解决的主要问题是能否正确地描述潜变量之间的内在联系。这种联系的大小和方向用结构系数(Structure coefficients)来标识。
    • 理论效度(nomological validity)
    • 预测效度(predictive validity)
    • 测量模型占据非常重要的地位,如果测量模型构造的不好,结构模型也将变得没有意义。
  4. 误差项的路径系数为1,这是设定。误差的方差可以估计。

2.3 分类

2.3.1 sem

  1. sem下,所有内生变量都是连续性变量,模型为线性回归模型。只能估计单层(singlel level)模型。
  2. sem独特的功能
    • 可以使用MLMV(保留缺失值极大似然估计)
    • 能报告拟合指标、修正指标
    • 能把影响分解为直接效应和间接效应
    • 能根据抽样方法和权重对标准误进行调校
    • 能估计ssd(summary-statistic data)
  3. 要求
    • 外生显变量可以不服从联合正态分布,不用管外生显变量。
    • 有时只需要(i.i.d)即可
    • 有时甚至不需要i.i.d,比如(渐进无分布估计ADF)
    • 在MLMV下,需要联合正态。
  4. 估计方法
    • 极大似然ml
    • 极大似然稳健估计qml
    • 渐进无分布估计
    • 保留缺失值极大似然估计MLMV

2.3.2 gsem

  1. gsem下,内生变量可以是连续型变量,也可以是二值、有序、计数、无序多项选择等。模型可以是线性回归,也可以是gamma回归,logit回归,ologit回归,oprobit回归,mlogit回归,泊松回归,负二项回归等等。可以估计多层结构。
  2. 估计方法
    • ml
    • qml

2.3.3 分类型潜变量模型

  1. 属于gsem模块
  2. 潜变量是分类型变量,采用的测量技术是联合概率分析。
  3. 包括潜类别分析和潜剖面分析

2.3.3 stat15的不足

  1. 还不能同时处理连续型潜变量和非连续型潜变量,即不能处理混合因子模型(mixture factor model)

参考文献

  1. 阳义南. 结构方程模型及Stata应用[M]. 北京: 北京大学出版社, 2021.

精益修身

2021/06/25  阅读:84  主题:橙心

作者介绍

精益修身