根据Bray, Lanzaa and Tanb (2015)的建议,我想执行三步法,通过使用包容性LCA(LCA包括协变量)的后验概率将个体分类。但是,如果我包括所有感兴趣的变量,则包含模型与非包含模型相比有很大不同。
条件概率以及每个类的案例数完全不同。因此,使用包容性LCA的后验概率(以分配案例)时,轮廓或模式的解释与非包容性模型(步骤1)完全不同。 我的问题是,我做错了什么吗?获得这些更改是否正常?程序可能不正确。当查看每个类别的项目条件概率时,模型本身会失去意义。
这些是我采取的步骤:
要执行LCA来研究性危险行为的概况(使用6个变量),并分析与不同类型的药物使用,性别和年龄的关联(模型4似乎是最佳选择)。
z <- cbind(sexrisk1, sexrisk2, sexrisk3, sexrisk4, sexrisk5, sexrisk6)
lc4 <- poLCA(z, MyData, nclass = 4,nrep=10)
将所有感兴趣的变量都包括在内,作为“适当的”后验分析的协变量(根据Bray,Lanzaa和Tanb(2015)的建议)
f <- cbind(sexrisk1, sexrisk2, sexrisk3, sexrisk4, sexrisk5, sexrisk6)~ drug1+drug2+drug3+gender+age
lc4.cov <- poLCA(f, MyData, nclass = 4,nrep=10)
一旦执行了包含模型,我就使用预测类和后验概率的值(我认为poLCA通过最大概率分配来做到这一点。不确定这一点)将案例分配给成员类。
table(lc4.cov$predclass)
write.csv(cbind(MyData$code, lc4.cov$posterior), 'new.data.csv')
(注意:通过增加两个模型(包括和不包括)的nrep数量,后验概率结果显示出较小的差异)。