如何在nnet包中的multinom()中设置特定的对比?

时间:2014-02-05 09:17:25

标签: r logistic-regression multinomial nnet

我有一个需要分类的3级问题。我想在nnet包中使用多项逻辑回归。 类结果有3个因子,P,Q,R。我想把Q作为基本因子。

所以我试着写下这样的对比:

P <- c(1,0,0)
R <- c(0,0,1)
contrasts(trainingLR$Class) <- cbind(P,R)

检查:

> contrasts(trainingLR$Class)
  P R
P 1 0
Q 0 0
R 0 1 

现在multinom()

library(nnet)
multinom(Class ~., data=trainingLR)

输出:

> multinom(Class ~., data=trainingLR)
# weights:  39 (24 variable)
initial  value 180.172415 
iter  10 value 34.990665
iter  20 value 11.765136
iter  30 value 0.162491
iter  40 value 0.000192
iter  40 value 0.000096
iter  40 value 0.000096
final  value 0.000096 
converged
Call:
multinom(formula = Class ~ ., data = trainingLR)

Coefficients:
  (Intercept)        IL8     IL17A      IL23A     IL23R
Q   -116.2881 -16.562423 -34.80174   3.370051  6.422109
R    203.2414   6.918666 -34.40271 -10.233787 31.446915
       EBI3     IL6ST     IL12A   IL12RB2     IL12B
Q -8.316808  12.75168 -7.880954  5.686425 -9.665776
R  5.135609 -20.48971 -2.093231 37.423452 14.669226
    IL12RB1    IL27RA
Q -6.921755 -1.307048
R 15.552842 -7.063026

Residual Deviance: 0.0001922658 
AIC: 48.00019 

问题:
所以如你所见,由于P类没有出现在输出中,这意味着它在处理R中的因子变量时按字母顺序被视为基数是第一个,而Q类是不是< / em>在这种情况下被视为基本级别,如何使其基于其他两个级别?

1 个答案:

答案 0 :(得分:3)

我试图避免使用对比,我发现relevel函数用于选择所需的水平作为基线。 以下代码

trainingLR$Class <- relevel(trainingLR$Class, ref = "P")

应将“P”级别设为您的基线。 因此,尝试使用“Q”或“R”级别进行同样的操作。

R文档(?relevel)提到“这对于contr.treatment对比有用,它将第一级作为参考。”

虽然现在回答可能为时已晚,但由于其他人可能会感兴趣,我认为值得分享上述选项。