如何在R?
中执行多变量(多个因变量)逻辑回归我知道你这样做是为了线性回归,这是有效的
form <-cbind(A,B,C,D)~shopping_pt+price
mlm.model.1 <- lm(form, data = train)
但是,当我尝试以下(见下文)进行逻辑回归时,它不起作用。
model.logistic <- glm(form, family=binomial(link=logit), data=train)
感谢您的帮助。
要添加,似乎我使用上述线性模型执行此操作的代码可能不正确。我正在尝试本文档中概述的内容,其中一些可能会有用。
ftp://ftp.cis.upenn.edu/pub/datamining/public_html/ReadingGroup/papers/multiResponse.pdf
答案 0 :(得分:2)
在我看来,lm(cbind(A,B,C,D)~shopping_pt+price)
只适用于四个因变量的四种不同模型。您提供的second link甚至提及:
单个系数以及它们的标准误差将与多元回归产生的系数相同。但是,OLS回归不会产生多变量结果,也不会允许测量方程中的系数。
意味着所有估计都是相同的,你只需要预测四次;拟合系数的假设在模型中是独立的。
我刚刚尝试过以下示例,表明它确实如此:
> set.seed(0)
> x1 <- runif(10)
> x2 <- runif(10)
> y1 <- 2*x1 + 3*x2 + rnorm(10)
> y2 <- 4*x1 + 5*x2 + rnorm(10)
> mm <- lm(cbind(y1,y2)~x1+x2)
> m1 <- lm(y1~x1+x2)
> m2 <- lm(y2~x1+x2)
# If we look at mm, m1 and m2, we see that models are identical
# If we predict new data, they give the same estimates
> x1_ <- runif(10)
> x2_ <- runif(10)
> predict(mm, newdata=list(x1=x1_, x2=x2_))
y1 y2
1 2.9714571 5.965774
2 2.7153855 5.327974
3 2.5101344 5.434516
4 1.3702441 3.853450
5 0.9447582 3.376867
6 2.3809256 5.051257
7 2.5782102 5.544434
8 3.1514895 6.156506
9 2.4421892 5.061288
10 1.6712042 4.470486
> predict(m1, newdata=list(x1=x1_, x2=x2_))
1 2 3 4 5 6 7 8 9 10
2.9714571 2.7153855 2.5101344 1.3702441 0.9447582 2.3809256 2.5782102 3.1514895 2.4421892 1.6712042
> predict(m2, newdata=list(x1=x1_, x2=x2_))
1 2 3 4 5 6 7 8 9 10
5.965774 5.327974 5.434516 3.853450 3.376867 5.051257 5.544434 6.156506 5.061288 4.470486
因此,这表明您可以单独使用四个逻辑模型。