1、首先我们来了解一下潜类别分析。潜在类别分析是通过对类别型的外显变量和潜在变量之间的关系建立统计模型, 根据模型参数得到各种潜在类别的具体外在表现的潜在特征分类技术。简单来讲比如说我们现在想研究青少年的物质滥用情况,那么我们测量的物质有很多,酒精,烟草,可卡因,等等各种药品毒品,物质的类别很多,然后我们收集的是二分类的变量,也就是相当于问青少年在过去的12个月内你是否吸食可卡因?得到的数据是“是”或者“否”的情况。遇到这样的数据,我们一般会是得一分,否得0分,然后将每个青少年的数据加起来得到他一个物质滥用的总分。这样做有两个不好的地方,首先不能很好的说明变量间的差异,比如都得到5分,但是在物质滥用的类别上是截然不同的。然后就是没有办法将数据个体进行分类,分类也只能是物质滥用的总分分为高中低。而不能根据数据的本身进行分类,因此潜类别分析正好填补了这个空白。
2、潜类别分析针对的是变量是二分类变量的情况,当变量是连续数据的情况成为潜在剖面分析,不过在MPLUS中都称之为LCA潜类别分析。下面我就mplus中的e7.3作为例子为大家讲解。TITLE: this is an example of a LCA with binary latent class indicators using automatic starting values with random startsDATA: FILE IS ex7.3.dat;VARIABLE: NAMES ARE u1-u4 x1-x10; *定义变量的名称USEVARIABLES = u1-u4; *定义所用到的变量CLASSES = c (2); *括号内的数字定义潜类别的个数CATEGORICAL = u1-u4; *界定进行潜类别分析的变量为类别变量。假如是连 续变量的话就可以不用填AUXILIARY = x1-x10 (e); *这一步假如没有的话可以直接略过,或者就直接不 管它。ANALYSIS: TYPE = MIXTURE; OUTPUT: TECH1 TECH8 TECH10;*在做的时候需要加上tech11和tech14。 tech11是在混合模型分析时报告LMR(lo- mendell-rubin)检验和校正的LMR检验,我 们再后面进行潜类别个数选择会用到的一个非 常重要的指标。tech14是混合模型分析时报告 BLRT(bootstrapped likelihood ratio test) 参数时用于确定潜类别个数用的参数。
3、然后我们看结果当中,模型的适配的检验指标主要有似然比Log likelihoo蟠校盯昂d检验,以及信息评价指标Ak锾攒揉敫aike information criterion( AIC) ,Bayesian information criterion( BIC) 和样本校正的BIC( aBIC) ,这几个数值越小表示模型拟合得越好( Muthén & Muthén,2010) 。在潜在类别分析中还经常使用Entropy 指数来评估分类的精确程度,Entropy 的取值范围在0 ~ 1 之间,当Entropy= . 6 时,表明约有20%的个体存在分类的错误,Entropy约等于. 8 时表明分类的准确率超过了90%( Carragher,Adamson,Bunting,& cCann,2009) 。此外Mplus 还提供了似然比检验指标Lo - Mendell- Rubin( LMR) 和基于Bootstrap 的似然比检验( BLRT)两个指标来比较潜在类别模型的拟合差异,如果这两个值的p 值达到显著水平,则表明k 个类别的模型显著的优于k - 1 个类别的模型( Muthén &Muthén,2010)muthen网站中的例子e7.3提供的数据是没有LMR和BLRT的数据的。当我们在output中加入tech11和tech14就会出来结果,然后我们主要看一下几个部分的结果就行了。
4、在结果当中我们只需要知道上述的几个指标就可以了。那么做潜类别分析我们是需要进行模型比较才能得出最后的结论的,一般模型的类别个数从1个慢慢累加,然后将各种参数列出表格再进行比对。在下一节我会为大家讲解一个例子。