为什么multinom()会为每个结果级别预测很多行的概率?

时间:2014-04-21 08:38:00

标签: r statistics prediction logistic-regression multinomial

我有一个moltinomial逻辑回归,结果变量有6个级别:10,20,60,70,80,90

test<-multinom(y ~ x1 + x2 +  as.factor(x3) ,data=data1)

我想预测每组给定输入值与y的每个级别相关联的概率。所以我运行这个:

 dfin <- data.frame( ses = c(10,20,60,70,80,90), x1=2.1, x2=4, x3=40)
 predict(test, todaydata = dfin, type = "probs")

但是我没有获得6个概率(每个结果级别一个),而是获得了许多概率。每行有6个概率(总和为1)但我不知道为什么我会得到很多行以及我应该信任哪一行。

5541   7.226948e-01 1.498199e-01 8.086624e-02 1.253289e-02 8.799416e-03 2.528670e-02
5546   6.034188e-01 7.386553e-02 1.908132e-01 1.229962e-01 4.716406e-04 8.434623e-03
5548   7.266859e-01 1.278779e-01 1.001634e-01 2.032530e-02 7.156766e-03 1.779076e-02
5562   7.120179e-01 1.471181e-01 9.146071e-02 1.265592e-02 8.189511e-03 2.855781e-02
5666   6.645056e-01 3.034978e-02 1.687687e-01 1.219601e-01 3.972833e-03 1.044308e-02
5668   4.875966e-01 3.126855e-02 2.090006e-01 2.430828e-01 3.721631e-03 2.532970e-02
5670   3.900772e-01 1.305786e-02 1.803779e-01 4.137106e-01 1.314298e-03 1.462155e-03
5671   4.272971e-01 1.194599e-02 1.748494e-01 3.833422e-01 8.863019e-04 1.678975e-03
5674   5.477521e-01 2.587478e-02 1.650817e-01 2.487404e-01 3.368726e-03 9.182195e-03
5677   4.300207e-01 9.532836e-03 1.608679e-01 3.946310e-01 2.626104e-03 2.321351e-03
5678   4.542981e-01 1.220728e-02 1.410984e-01 3.885146e-01 2.670689e-03 1.210891e-03
5705   5.642322e-01 1.830575e-01 5.134181e-02 8.952808e-04 8.796467e-03 1.916767e-01
5706   6.161694e-01 1.094046e-01 1.979044e-01 1.095385e-02 7.254592e-03 5.831323e-02
....

我在编码中遗漏了什么,或者我是否需要设置任何参数?

1 个答案:

答案 0 :(得分:2)

它将观察的概率返回到每个类中。这就是多项逻辑回归的实现方式。您可以想象一系列二项式逻辑回归(每个类一个),然后选择具有最高概率的类。这被称为one-v-all方法。

在您的示例中,观察5541预测为1级,因为第一列具有最高值(概率)。观察5670是第4类,因为它是具有最高概率的列。矩阵的尺寸为# of observations x # of classes