进行潜在类别分析时,有时信息标准(即AIC,BIC,aBIC)不会选择相同的模型。我在774名男男性接触者中进行的物质使用模式研究就是这种情况。图1显示了为每个潜在类别绘制的拟合标准。 BIC和CAIC选择三个类模型(见图2)。但是,aBIC选择五类模型(参见图2)。
在这种情况下,您如何选择模型解决方案?有没有办法选择变量或折叠变量以优化结果?
答案 0 :(得分:3)
选择LCA的课程数量绝非易事,但我遵循一些经验法则:
在你的情况下,我会从一个3类模型开始,因为它是由BIC和简约建议的。在完成分析并解释结果之后,我会用4/5课程重新运行该模型,看看我是否会得到截然不同的发现 - 值得报告的内容,任何重要或矛盾的发现,我发现的3类模型。如果它只是增加了复杂性,但并不矛盾或改进我已经知道的东西,我就会坚持使用3级模型。
观察结果,我认为5类模型不提供3个类以外的任何东西。在3类模型中,你有一类广泛的吸毒者(16%),以大麻,波普,致幻剂和可卡因为主的中度吸毒者(40%),最后是一类以酒精和大麻为主的轻度吸毒者(44 %)。 5类模型将前两组划分为特定的较小的子组,但您必须确定这些拆分对您的研究是否重要 - 它们是否对您的研究问题有意义。
我还建议检查双变量残差。建议更多类的模型错配可能是由指标之间的残差关联产生的。如果你可以在理论上证明它(例如通过在潜类之外找到指标之间的某些相似性),你可以添加残差关联并获得与3类模型类似的良好拟合。
最后一点,完全避免将AIC用于LCA - 这是一个性能非常差的索引!请改用cAIC,BIC和aBIC。 AIC不会对样本量进行校正,对于较大的样本,这可能会产生很大的问题。
<强>来源强>:
Collins,L。M.,&amp; Lanza,S。T.(2010)。潜在类和潜在过渡分析:适用于社会,行为和健康科学。纽约:威利。