在poLCA R包中找到最佳LCA模型

时间:2018-02-14 18:28:05

标签: r for-loop cluster-analysis data-science categorical-data

我正在使用PoLCA R软件包进行LCA分析,但分析结果自三天以来未得到(它尚未找到最佳模型),偶尔会出现以下错误:“警告:迭代完成,最大可能没有找到” 。所以我在35个潜班上取消了这个过程。我正在分析16个变量(所有这些变量都是分类的)和36036行数据。当我在Boruta软件包中测试16个变量的变量重要性时,所有16个变量都是重要的,所以我在使用poLCA的LCA分析中使用了所有16个变量。我应该遵循哪条路?我是否应该使用其他聚类方法(如k-modes)来聚类此数据集中的分类变量?我使用500次迭代的参数和nrep = 10模型估计数。我使用R脚本在LCA中找到最佳模型,其中一个输出如下:

    for(i in 2:50){
    lc <- poLCA(f, data, nclass=i, maxiter=500, 
                tol=1e-5, na.rm=FALSE,  
                nrep=10, verbose=TRUE, calc.se=TRUE)
    if(lc$bic < min_bic){
        min_bic <- lc$bic
        LCA_best_model<-lc
    }
}
  

=============================================== ==========适合35个潜在课程:   ================================================== =======观察次数:36036
  估计参数数量:2029残差   自由度:34007
  最大对数似然:-482547.1
  AIC(35):969152.2   BIC(35):986383 G ^ 2(35):233626.8(可能性   比率/偏差统计量)
  X ^ 2(35):906572555(卡方的善良   适合)
  警告:迭代完成,最大可能没有找到

0 个答案:

没有答案