这是我的数据头(两者):
season gender age prog grade
fall woman old FRIST B
fall woman old FRIST A
spring woman old FRIST E
spring man old NMATK C
spring woman old NFYSK A
fall woman old FRIST E
我想进行逻辑回归,其中成绩是响应变量。我想让其中四个是独立的。
下面:
E/A+B+C+D=alpha_1+beta^x_1+beta^y_1+...
D+E/A+B+C=alpha_2+beta^x_2+beta^y_2+...
C+D+E/A+B=alpha_3+beta^x_3+beta^y_3+...
B+C+D+E/A=alpha_4+beta^x_4+beta^y_4+...
我做了什么:
library(MASS)
y <- factor(both$betyg)
mod.fit <- polr(y ~ prog + gender + age + season, data=both, Hess=TRUE)
summary(mod.fit)
然后我收到这条消息:
警告讯息: 在polr中(y~prog + gender + age + season,data = both,Hess = TRUE): 设计似乎是排名不足的,所以放弃了一些系数
我知道这不是一个错误只是一个警告。我不知道如何解释它或以不同的方式做什么来避免这个消息?
答案 0 :(得分:1)
由于您的结果是有序的,您可能会在顺序方面做得更好,但可能需要检查比例赔率假设。您所描述的模型几乎就是polr
所做的,尽管它们并不像您所说的那样独立。加州大学洛杉矶分校有一个很好的教程。
至于确定哪种模型最佳,在处理这些基本不同类型的模型时,我建议进行交叉验证。预测准确性并不存在,任何伪R ^ 2指标在不同模型的解释上都会有所不同。
此外,由于这个问题涉及统计数据而不是R编码/实现,我建议使用CrossValidated(统计数据StackExchange网站)。