我有一个需要分类的3级问题。我想在nnet
包中使用多项逻辑回归。
类结果有3个因子,P,Q,R。我想把Q作为基本因子。
所以我试着写下这样的对比:
P <- c(1,0,0)
R <- c(0,0,1)
contrasts(trainingLR$Class) <- cbind(P,R)
检查:
> contrasts(trainingLR$Class)
P R
P 1 0
Q 0 0
R 0 1
现在multinom()
:
library(nnet)
multinom(Class ~., data=trainingLR)
输出:
> multinom(Class ~., data=trainingLR)
# weights: 39 (24 variable)
initial value 180.172415
iter 10 value 34.990665
iter 20 value 11.765136
iter 30 value 0.162491
iter 40 value 0.000192
iter 40 value 0.000096
iter 40 value 0.000096
final value 0.000096
converged
Call:
multinom(formula = Class ~ ., data = trainingLR)
Coefficients:
(Intercept) IL8 IL17A IL23A IL23R
Q -116.2881 -16.562423 -34.80174 3.370051 6.422109
R 203.2414 6.918666 -34.40271 -10.233787 31.446915
EBI3 IL6ST IL12A IL12RB2 IL12B
Q -8.316808 12.75168 -7.880954 5.686425 -9.665776
R 5.135609 -20.48971 -2.093231 37.423452 14.669226
IL12RB1 IL27RA
Q -6.921755 -1.307048
R 15.552842 -7.063026
Residual Deviance: 0.0001922658
AIC: 48.00019
问题:
所以如你所见,由于P类没有出现在输出中,这意味着它在处理R中的因子变量时按字母顺序被视为基数是第一个,而Q类是不是< / em>在这种情况下被视为基本级别,如何使其基于其他两个级别?
答案 0 :(得分:3)
我试图避免使用对比,我发现relevel
函数用于选择所需的水平作为基线。
以下代码
trainingLR$Class <- relevel(trainingLR$Class, ref = "P")
应将“P”级别设为您的基线。 因此,尝试使用“Q”或“R”级别进行同样的操作。
R文档(?relevel
)提到“这对于contr.treatment
对比有用,它将第一级作为参考。”
虽然现在回答可能为时已晚,但由于其他人可能会感兴趣,我认为值得分享上述选项。