潜类分析模型选择

时间:2017-06-21 23:00:13

标签: statistics

进行潜在类别分析时,有时信息标准(即AIC,BIC,aBIC)不会选择相同的模型。我在774名男男性接触者中进行的物质使用模式研究就是这种情况。图1显示了为每个潜在类别绘制的拟合标准。 BIC和CAIC选择三个类模型(见图2)。但是,aBIC选择五类模型(参见图2)。

在这种情况下,您如何选择模型解决方案?有没有办法选择变量或折叠变量以优化结果?

1 个答案:

答案 0 :(得分:3)

选择LCA的课程数量绝非易事,但我遵循一些经验法则:

  1. 基于Nylund, Asparouhov & Muthén (2007),您希望遵循BIC和引导似然比检验(BLRT)。即使这样,他们也很少同意--BRRT会告诉你选择一个有更多课程的模型,BIC会更保守,并建议更少的课程。但是,通过统计测试可以得到尽可能接近的结果。
  2. 依靠您模型的可用理论。寻找与理论知识的潜在差异,并尝试从理论中推断出预期有多少类。没有黄金法则,LCA是一个很好的方法,但没有理论它是毫无意义的。如果你的理论很少,那么你可以做些什么来仔细检查你的发现是将你的潜在变量与一个远端结果(协变量)联系起来,你可能会有一些理论,看看它是否有效。例如,您怀疑某个潜在课程将由一个性别主导:将您的潜在变量与性别相关联并查看。
  3. 简约规则:简单模型优于复杂模型(Collins& Lanza,2010)。如果一个更简单的模型完成所有工作,为什么选择一个复杂的模型呢?
  4. 在你的情况下,我会从一个3类模型开始,因为它是由BIC和简约建议的。在完成分析并解释结果之后,我会用4/5课程重新运行该模型,看看我是否会得到截然不同的发现 - 值得报告的内容,任何重要或矛盾的发现,我发现的3类模型。如果它只是增加了复杂性,但并不矛盾或改进我已经知道的东西,我就会坚持使用3级模型。

    观察结果,我认为5类模型不提供3个类以外的任何东西。在3类模型中,你有一类广泛的吸毒者(16%),以大麻,波普,致幻剂和可卡因为主的中度吸毒者(40%),最后是一类以酒精和大麻为主的轻度吸毒者(44 %)。 5类模型将前两组划分为特定的较小的子组,但您必须确定这些拆分对您的研究是否重要 - 它们是否对您的研究问题有意义。

    我还建议检查双变量残差。建议更多类的模型错配可能是由指标之间的残差关联产生的。如果你可以在理论上证明它(例如通过在潜类之外找到指标之间的某些相似性),你可以添加残差关联并获得与3类模型类似的良好拟合。

    最后一点,完全避免将AIC用于LCA - 这是一个性能非常差的索引!请改用cAIC,BIC和aBIC。 AIC不会对样本量进行校正,对于较大的样本,这可能会产生很大的问题。

    <强>来源

    Collins,L。M.,&amp; Lanza,S。T.(2010)。潜在类和潜在过渡分析:适用于社会,行为和健康科学。纽约:威利。