潜在类作为因变量

时间:2018-10-17 10:27:58

标签: r regression

我正在尝试找出如何将LCA建模生成的潜在类用作回归中的依赖变量。

poLCA(及其他)的软件文档似乎仅显示了如何将潜在类用作独立变量,例如在本示例中,PARTY和AGE如何解释该类成员资格。

但是,我有兴趣做相反的事情,例如,了解类的成员资格如何影响y(例如,以PARTY为例)。

library(poLCA)
data("election")

f.party <- cbind(MORALG, CARESG, KNOWG, LEADG, DISHONG, INTELG, MORALB, CARESB, 
KNOWB, LEADB, DISHONB, INTELB) ~ PARTY + AGE

# run the LCA estimation #
nes.party <- poLCA(f.party, election, nclass = 3, verbose = FALSE)

我了解可以使用

检索类成员身份
nes.party$predclass

并且可以用以下方法取回后proba

nes.party$posterior

但是,我不说如何在OLS中使用此信息。

lm(PARTY ~ predclass, election)

是错误的,因为我要考虑类概率成员身份。

你会怎么做?

1 个答案:

答案 0 :(得分:2)

我在进行相关搜索时遇到了这个问题,因此答复很晚。

潜在类是多项式(即无序类别)结果,因此所需的平行项不是线性回归-它是多项式回归。实际上,您可以预测每个人最有可能的潜在类别,然后将其输入多项式回归模型。但是,那将是一个错误的方法,因为它无法说明潜在类的估计是不确定的。

我听说过潜在类回归一词,用于描述您何时尝试查看预测变量是否与类成员资格有任何关联,而没有被用作指标变量本身。实际上,poLCA确实允许这样做。参见page 3 of the manual

## Example 2. Two-class latent class regression using
## GPA as a covariate to predict class membership as
## "cheaters" vs. "non-cheaters".
## (Table 7.1, p. 85, and Figure 7.1, p. 86)
##
f2 <- cbind(LIEEXAM,LIEPAPER,FRAUD,COPYEXAM)~GPA
ch2c <- poLCA(f2,cheating,nclass=2) # log-likelihood: -429.6384
GPAmat <- cbind(1,c(1:5))
exb <- exp(GPAmat %*% ch2c$coeff)
matplot(c(1:5),cbind(1/(1+exb),exb/(1+exb)),type="l",lwd=2,
main="GPA as a predictor of persistent cheating",
xlab="GPA category, low to high",
ylab="Probability of latent class membership")

复制粘贴了他们的示例。在这里,他们使用GPA来预测两个潜在类别的成员资格,这两个潜在类别由4个描述作弊倾向的指标定义。