LCA的诊断原理及其应用

1 前言
潜在类别分析（latent class analyse,LCA）意指通过对类别型的外显变量和潜在变量之间的关系建立统计模型，根据模型参数得到各种潜在类别的具体外在表现的潜在特征分析技术。潜在类别分析是在因素分析的基础上延伸出来的一种方法。因素分析只用于处理外显变量和潜在变量都为连续型变量，而潜在类别分析作为潜在结构分析的一种，处理的外显变量和潜在变量都为类别型变量，弥补了因素分析和潜在特质分析在处理数据类别上的缺陷。在实际的研究中，心理学研究数据大部分属于类别型数据，如人格特质、创造力等。因而，潜在类别分析技术不仅在心理统计研究中具有重要的方法学意义，也在心理诊断研究中得到广泛的实际应用。
本文对潜在类别分析进行了文献检索。截止到2015年8月，在CNKI中国知网上，对篇名包含“潜在类别”的文献进行检索，发现总共有48篇文献，其中11篇为会议摘要，无法搜索全文，共余37篇文献涉及教育测验，社会调查和医学、计算机和数理等各个领域。对主题包含“潜在类别”的文献进行检索，查找共有123篇文献，内容大多涉及到医学、心理学和教育学等相关领域。特别是自2008年邱皓政出版《潜在类别分析原理与技术》一书之后，关于潜在类别的文献出现迅猛的递增。图1、图2描绘了潜在类别分析近年来的发展趋势。相比之下，虽然国外关于LCA的应用较早就已经开始，但是将LCA应用在诊断研究中则是在2000年后才慢慢兴起。Maarten van Smeden等人（2013）进行了一项关于潜在类别应用在诊断上的实证研究的统计，搜索的主题词是“Latent class”、“Latent classes”、“Finate mixture”和“Finate mixtures”，在全文中进行搜索，共发现1704篇文献，经验证后有179篇文献符合条件。大多数文献主要的研究目的在于采用LCA方法考察某种分类方法的有效性。就国内关于潜在类别研究方法而言，应用于群体的分类研究中较多，应用于诊断研究的很少。
在诊断研究领域中，相对于还在发展的LCA方法，认知诊断（cognitive diagnose,简称CD）研究方法是一种更为成熟的方法。认知诊断是结合认知心理学和心理测量学理论，将现代统计学方法融合到计算机技术中，用以诊断学生的认知能力的方法（陈秋梅，张敏强，2010）。认知诊断方法与LCA方法都在教育测量中应用广泛，其共同点在于，都是将被试掌握的认知能力或知识属性看做潜在特质，通过被试在项目上作答反应将其进行分类。随着计算机技术的飞速发展，认知诊断方法的发展也得到了广泛的应用，就近二十年来，仅认知诊断模型就已有一百余种。即便如此，但就实证研究中，LCA方法比认知诊断方法应用更为广泛。从宏观上来说，这是由于开展大规模认知诊断测试需要政策的大力支持，而目前来说政策支持远远不够（秦春影，仝海燕，2014）；其次认知诊断模型的使用条件受多方面的限制，即便诊断模型种类丰富，但大多情况下不满足实际情况的使用。微观上而言，根源在于两种方法的本身，关于两者比较在文章第四部分有详细说明。

图1 潜在类别分析方法在各个学科上应用量的论文情况统计

图2 潜在类别分析方法随时间应用量变化的论文情况统计
最常用的LCA工具有SAS软件安装包，R软件和Latent Gold软件。SAS和R软件中一般使用编程语句，通过语句对模型进行设定。而Latent Gold软件分为可编程和不可编程两种类型。可编程软件操作与前两者类似，但是在参数设定方面略有不同，而不可编程的Latent Gold软件类似SPSS的窗口式操作界面，简单方便，缺点是使用起来较为局限。
2 LCA的基本原理
心理学的研究中，多通过样本外显的、可测的行为表现对个体潜在或内隐的心里特质进行间接的测量。因此，潜在结构分析（latent structure analysis）在心理学研究的统计中有着重要的方法学意义。潜在类别分析是潜在结构分析中的一种，它是通过潜在类别模型（Latent Class Model,LCM），用潜在的类别变量来解释外显的类别变量之间的关联，使外显变量之间的关系通过潜在类别变量X来估计，进而维持其局部独立性。其基本假设是，各外显变量各种反应的概率分布可以由少数互斥的潜在类别变量来解释，每种类别对各外显变量的反应选择都有特定的倾向。LCA与因素分析在方法和功能上十分相似，因此也有研究者将LCA看作是类别型变量的因素分析，但两者数理基础并不相同。
在LCM模型中，最常用的模型求解方法是极大似然法，对于一个具有T潜在类别的模型，其联合极大似然估计函数为：
……（1）
其中，表示概率估计值，、、分别表示A、B、C三个外显变量的类别概率，又称条件概率。LCM的基本原理为，以零模型为基础模型（即假设所有的被试反应模式都是同质的），在此基础上依次增加潜在类别数目，检查模型与实际数据的拟合情况，选取最优模型。选择最优模型之后，根据条件概率观察各潜在类别在各外显指标上的反应倾向，并据此对各个潜在类别进行命名。最后根据后验概率对各个作答模式所属潜在类别进行估计，以此将被试进行归类。在LCA分析中，涉及到以下一些关键步骤，分别是前提假设的违背性、模型选择依据以及参数设定。以下稍作介绍。
2.1 前提假设
模型的两个基本假设：1）局部独立性，即在某个潜在类别下，各个外显变量之间的作答反应互不干扰，如公式（2）所示。
（2）
2）互斥性，即各个潜在类别之间互不关联。如公式（3）所示。
（3）
其中，是被试i在第k个外显变量的作答，是第k个外显变量个作答水平之一；是某被试的作答向量，s是某种可能的作答向量；潜在类别变量为，潜在类别数为t。潜在类别模型在诊断上的应用过程中，s和t都只能取值为0或1，一般而言，0表示不出现这种情况，1表示出现这种情况。其中是当外显变量之间存在局部独立性时，被试属于第t种潜在类别的概率，是第t种潜在类别的被试在题作答为的条件概率。
2.2 模型选择
2.2.1根据指标
根据不同的指标选择合适的模型是绝大多数研究者选择的方式。在各个竞争模型中，最常用的模型选择指标有AIC和BIC。AIC是Akaike(1973,1987)所发展起来的一种基于信息理论的模型适配指标，适用于不同模型适配优劣的比较。AIC的计算是以极大似然法推导而来的，AIC越小，表示模型的适配性越好。此外，AIC可能会有不同的形式，一些软件如Latent Gold中提供的AIC指标包括AIC3和CAIC指标，这些指标的推导过程与AIC类似。当比较两个及以上的模型的适配性时，AIC指标能够反映出若更换新样本进行交叉效度验证的似然函数值增加量最小的模型，因而AIC多应用于交叉效度验证的模型选择。AIC适用于模型所估计的参数量较少，自由度较大的情形。
BIC是Schwarz(1978)基于贝氏理论提出的，又被称为Schwarz criterion 或Schwarz information criterion。它是针对AIC所存在的局限而发展起来的。AIC指标的缺点在于未考虑样本数的影响，因而当样本数较大时，AIC的概率推导的渐进性缺乏，此时，运用BIC能够改善这一渐进性不足的问题。BIC在AIC的基础上增加了一个调整项，将样本量的影响纳入考虑范畴，这使得BIC适用的范围更广。Lin等人（1997）指出，当样本量达到千人以上或者模型的参数较少时，BIC较AIC是更佳的决策指标。在时间序列数据中，BIC也是较佳的指标（邱皓政，2008）。
当然，在选择模型时除了要考虑上述指标值外，研究者还需要考虑模型的简洁性，参数过多往往会出现模型在迭代过程中不收敛的情况。
2.2.2根据研究者对分类结果的解释度
另一种选择模型的普遍方式是根据研究者对分类结果的解释度。与数据驱动的根据指标选择适配性模型相比，这一方法更像是理论推动，因为它往往有一存在的前提理论。例如，研究者对青少年自伤行为进行分类，发现以往的研究者将研究对象分为三种潜在类别较多，一般将这三种潜在类别命名为“高危组”、“低危组”和“边缘组”。此时，即使对研究数据做探索性潜在类别分析发现四类别的潜在类别模型在实际中拟合数据更优，BIC和AIC的值都更小，但研究者依然会倾向于选择三类别的潜在类别模型。
在模型选择中，影响到模型有效性的另一个关键因素是外显变量的选择，或外显诊断测试的选择。当外显变量（或外显诊断测试）较多时，可以选择“剔除-纳入”法（leave-1-out）。它是指将某一个外显变量（或外显诊断测试）剔除之后所得的LCM模型的分类结果与纳入该外显变量（或外显诊断测试）时的LCM模型分类结果进行对比。一方面，这一做法可以检验模型分类的有效性；另一方面，当某一外显变量（或外显诊断测试）剔除之后所得到的模型分类结果与总的LCM差异较大时，说明该外显变量的选择可能需要更为慎重。Van smeden等人(2013)通过文献检索，对LCM用于检验诊断测试有效性的64篇实证研究文献进行分析发现，只有5篇采用此方法验证模型的有效性，所占比例不到8%。大约28%的研究中并没有使用任何一种方法，如外部效度法、模型拟合优度法等论证LCM模型的有效性。以上表明，模型选择在以往的研究中经常被忽视。
2.3 参数设定
在LCM中，通常采用极大似然法估计参数。然而，不是所有情形下LCM都能被识别。LCM被识别的一个重要条件是：在LCM中，自由估计的参数不超过外显诊断测试的数目（van Smeden, M et.al.，2014）。例如：无限定性的二类别LCM中，当外显诊断测试的个数R<3时，模型无法识别。当R=3时，理论上来说，模型刚好能够被识别，此时，该模型的自由度为0，但即使自由度是非负的，有时也不能成为模型可识别的充分条件。Goodman, L. A. (1974)研究中发现，在某种情况下，当潜在类别数为三类别而外显诊断数目为四时，自由度df=1>0，但模型依旧无法识别。
3 LCA在诊断上的应用
3.1 人格诊断
在人格诊断方面，传统的心理诊断标准（diagnostic and statistical manual of mental disorders，DSM）一般将人格或其他心理诊断分为两大类。然而有研究者认为，二分性质的诊断方式可能会忽视个体复杂的临床信息（McGlashan, 1987），对于边缘性人格障碍（borderline personality disorder，BPD ），究竟应该诊断为类别型（即人格障碍出现与否）还是应视为连续型（即人格障碍的严重性程度）在理论和实证性文献中存在争议（Edens,Marcus, & Ruiz, 2008; Rothschild, Cleland, Haslam, & Zimmer-man, 2003; Trull, Widiger, Lynam, & Costa, 2003; Wilberg,Urnes, Friis, Pedersen, & Karterud, 1999）。对于以上两派之争，有研究者提出，LCA是一种较为折中的方法，该方法既能够避免二分性质的类别型诊断，也能获取类似连续型诊断的重要临床信息（Bornovalova, M. A., Levy, R., Gratz, K. L., & Lejuez, C. W.，2010）。Bornovalova等人(2010)以DSM-IV中的BPD临床诊断标准为外显变量，将被试群体分为四个潜在类别，分别是基础参照组（无明显边缘性人格障碍特征）、高发组、中度组和中低组。随后研究者对这四组潜在类别进行了人口学变量的差异检验，进一步阐述了BPD的四种类别的具体人格特征表现和差异性。Fossat