我正在尝试找出如何将LCA建模生成的潜在类用作回归中的依赖变量。
poLCA
(及其他)的软件文档似乎仅显示了如何将潜在类用作独立变量,例如在本示例中,PARTY和AGE如何解释该类成员资格。
但是,我有兴趣做相反的事情,例如,了解类的成员资格如何影响y
(例如,以PARTY为例)。
library(poLCA)
data("election")
f.party <- cbind(MORALG, CARESG, KNOWG, LEADG, DISHONG, INTELG, MORALB, CARESB,
KNOWB, LEADB, DISHONB, INTELB) ~ PARTY + AGE
# run the LCA estimation #
nes.party <- poLCA(f.party, election, nclass = 3, verbose = FALSE)
我了解可以使用
检索类成员身份nes.party$predclass
并且可以用以下方法取回后proba
nes.party$posterior
但是,我不说如何在OLS中使用此信息。
做
lm(PARTY ~ predclass, election)
是错误的,因为我要考虑类概率成员身份。
你会怎么做?
答案 0 :(得分:2)
我在进行相关搜索时遇到了这个问题,因此答复很晚。
潜在类是多项式(即无序类别)结果,因此所需的平行项不是线性回归-它是多项式回归。实际上,您可以预测每个人最有可能的潜在类别,然后将其输入多项式回归模型。但是,那将是一个错误的方法,因为它无法说明潜在类的估计是不确定的。
我听说过潜在类回归一词,用于描述您何时尝试查看预测变量是否与类成员资格有任何关联,而没有被用作指标变量本身。实际上,poLCA确实允许这样做。参见page 3 of the manual。
## Example 2. Two-class latent class regression using
## GPA as a covariate to predict class membership as
## "cheaters" vs. "non-cheaters".
## (Table 7.1, p. 85, and Figure 7.1, p. 86)
##
f2 <- cbind(LIEEXAM,LIEPAPER,FRAUD,COPYEXAM)~GPA
ch2c <- poLCA(f2,cheating,nclass=2) # log-likelihood: -429.6384
GPAmat <- cbind(1,c(1:5))
exb <- exp(GPAmat %*% ch2c$coeff)
matplot(c(1:5),cbind(1/(1+exb),exb/(1+exb)),type="l",lwd=2,
main="GPA as a predictor of persistent cheating",
xlab="GPA category, low to high",
ylab="Probability of latent class membership")
复制粘贴了他们的示例。在这里,他们使用GPA来预测两个潜在类别的成员资格,这两个潜在类别由4个描述作弊倾向的指标定义。