R中的手动预测(数据框)

时间:2016-06-09 16:38:49

标签: r dataframe prediction

我有数据框:

DF
   Chset Choices X1 X2 utility
1      1       8  1  1       2
2      1       2  0  1       3
3      1       1  1  0      -1
4      2       1  1  1       2
5      2       5  0  1       5
6      2       1  1  0      -1
7      2       2  0  0       0
8      3       1  1  1       2
9      3       2  0  1       6
10     3       5  1  0      -1
11     4       6  1  1       2
12     4       1  0  1      14
13     4       1  1  0      -1
14     4       1  0  0       0

我想创建列“预测”,如果实用程序在Chset中最大,我放置1。例如,我们有3行,其中Chset = 1,那些有实用程序(2,3,-1)。然后,在“预测”列中,对于第2行应为(0,1,0) - 1,因为它在Chset = 1中具有最大效用,依此类推:

   Chset Choices X1 X2 utility predict
1      1       8  1  1       2       0
2      1       2  0  1       3       1
3      1       1  1  0      -1       0
4      2       1  1  1       2       0
5      2       5  0  1       5       1
6      2       1  1  0      -1       0
7      2       2  0  0       0       0
8      3       1  1  1       2       0
9      3       2  0  1       6       1
10     3       5  1  0      -1       0
11     4       6  1  1       2       0
12     4       1  0  1      14       1
13     4       1  1  0      -1       0
14     4       1  0  0       0       0

在那之后,我想贬低,预测是否正确。 如果predict = 1,则预测是正确的,并且“Choices”列中的值是其“Chset”中的最大值。例如,在Chset = 1中,我们可以看到第2行的“predict”= 1,而Chset = 1的最大“Choices”在第1行(并且等于8),因此预测是不正确的。相反,在Chset = 2中,对于第5行,“predict”等于1,并且该行在该Chset = 2内具有“Choices”的最大值,因此这里的预测是正确的。为了贬低所有情况,我想创建表“cheak”,如果预测正确则等于1,反之亦然。最后,我应该得到:

   Chset Choices X1 X2 utility predict cheak
1      1       8  1  1       2       0     0 
2      1       2  0  1       3       1     0
3      1       1  1  0      -1       0     0
4      2       1  1  1       2       0     0
5      2       5  0  1       5       1     1
6      2       1  1  0      -1       0     0
7      2       2  0  0       0       0     0
8      3       1  1  1       2       0     0
9      3       2  0  1       6       1     0
10     3       5  1  0      -1       0     0
11     4       6  1  1       2       0     0
12     4       1  0  1      14       1     0
13     4       1  1  0      -1       0     0
14     4       1  0  0       0       0     0

我该怎么做?

等待你的帮助

1 个答案:

答案 0 :(得分:1)

这应该这样做

DF <- 
unsplit(lapply(split(DF, DF$Chset),
               function(x)  within(x, {
                   predict <- as.numeric(utility == max(utility))
                   check <- as.numeric(Choices == max(Choices) & predict == 1)
               })),
        DF$Chset)