我有数据框:
DF
Chset Choices X1 X2 utility
1 1 8 1 1 2
2 1 2 0 1 3
3 1 1 1 0 -1
4 2 1 1 1 2
5 2 5 0 1 5
6 2 1 1 0 -1
7 2 2 0 0 0
8 3 1 1 1 2
9 3 2 0 1 6
10 3 5 1 0 -1
11 4 6 1 1 2
12 4 1 0 1 14
13 4 1 1 0 -1
14 4 1 0 0 0
我想创建列“预测”,如果实用程序在Chset中最大,我放置1。例如,我们有3行,其中Chset = 1,那些有实用程序(2,3,-1)。然后,在“预测”列中,对于第2行应为(0,1,0) - 1,因为它在Chset = 1中具有最大效用,依此类推:
Chset Choices X1 X2 utility predict
1 1 8 1 1 2 0
2 1 2 0 1 3 1
3 1 1 1 0 -1 0
4 2 1 1 1 2 0
5 2 5 0 1 5 1
6 2 1 1 0 -1 0
7 2 2 0 0 0 0
8 3 1 1 1 2 0
9 3 2 0 1 6 1
10 3 5 1 0 -1 0
11 4 6 1 1 2 0
12 4 1 0 1 14 1
13 4 1 1 0 -1 0
14 4 1 0 0 0 0
在那之后,我想贬低,预测是否正确。 如果predict = 1,则预测是正确的,并且“Choices”列中的值是其“Chset”中的最大值。例如,在Chset = 1中,我们可以看到第2行的“predict”= 1,而Chset = 1的最大“Choices”在第1行(并且等于8),因此预测是不正确的。相反,在Chset = 2中,对于第5行,“predict”等于1,并且该行在该Chset = 2内具有“Choices”的最大值,因此这里的预测是正确的。为了贬低所有情况,我想创建表“cheak”,如果预测正确则等于1,反之亦然。最后,我应该得到:
Chset Choices X1 X2 utility predict cheak
1 1 8 1 1 2 0 0
2 1 2 0 1 3 1 0
3 1 1 1 0 -1 0 0
4 2 1 1 1 2 0 0
5 2 5 0 1 5 1 1
6 2 1 1 0 -1 0 0
7 2 2 0 0 0 0 0
8 3 1 1 1 2 0 0
9 3 2 0 1 6 1 0
10 3 5 1 0 -1 0 0
11 4 6 1 1 2 0 0
12 4 1 0 1 14 1 0
13 4 1 1 0 -1 0 0
14 4 1 0 0 0 0 0
我该怎么做?
等待你的帮助
答案 0 :(得分:1)
这应该这样做
DF <-
unsplit(lapply(split(DF, DF$Chset),
function(x) within(x, {
predict <- as.numeric(utility == max(utility))
check <- as.numeric(Choices == max(Choices) & predict == 1)
})),
DF$Chset)