再一次,我为提出这类问题而道歉,但R世界太大了,以至于有时候我感到迷茫,即使我读过一些与R有关的最好的书。 我有以下数据库
ID=rep((1:3),3)
x<-as.Date("2013-1-1")
y<-as.Date("2013-1-2")
z<-as.Date("2013-1-3")
DATE<-c(x,x,x,y,x,y,z,z,z)
TRAP<-c(1,1,1,3,2,3,2,1,3)
IN<-data.frame(ID,DATE,TRAP)
我希望根据以下条件生成二进制变量(RESULT):如果DATE和TRAP对于不同的ID是相同的,那么RESULT&gt; y否则RESULT&gt; n,就像这样
RESULT<-c("y","y","y","y","n","y","n","n","n")
OUT<-cbind(IN,RESULT)
我认为应该使用ifelse
函数,但我不知道如何明确每个ID的相等控制条件......
一如既往,非常感谢每一个建议!
答案 0 :(得分:4)
以下是使用plyr
:
R> ddply(IN, .(DATE,TRAP), transform, RESULT=ifelse(length(ID)>1,"y","n"))
ID DATE TRAP RESULT
1 1 2013-01-01 1 y
2 2 2013-01-01 1 y
3 3 2013-01-01 1 y
4 2 2013-01-01 2 n
5 1 2013-01-02 3 y
6 3 2013-01-02 3 y
7 2 2013-01-03 1 n
8 1 2013-01-03 2 n
9 3 2013-01-03 3 n
请注意,行已重新排序。
data.table
的另一种解决方案:
R> DT <- data.table(IN)
R> DT[,RESULT:=ifelse(.N>1,"y","n"), by=list(DATE,TRAP)]
R> DT
ID DATE TRAP RESULT
1: 1 2013-01-01 1 y
2: 2 2013-01-01 1 y
3: 3 2013-01-01 1 y
4: 1 2013-01-02 3 y
5: 2 2013-01-01 2 n
6: 3 2013-01-02 3 y
7: 1 2013-01-03 2 n
8: 2 2013-01-03 1 n
9: 3 2013-01-03 3 n
这里没有重新排序。
或使用基础ave
:
IN <- within(IN, { RESULT <- ave(TRAP, list(DATE, TRAP),
FUN= function(x) ifelse(length(x) > 1, "y", "n"))})
# ID DATE TRAP RESULT
# 1 1 2013-01-01 1 y
# 2 2 2013-01-01 1 y
# 3 3 2013-01-01 1 y
# 4 1 2013-01-02 3 y
# 5 2 2013-01-01 2 n
# 6 3 2013-01-02 3 y
# 7 1 2013-01-03 2 n
# 8 2 2013-01-03 1 n
# 9 3 2013-01-03 3 n
答案 1 :(得分:1)
您可以使用duplicated
:
IN$RESULT <- ifelse((duplicated(IN[,2:3])+duplicated(IN[,2:3],fromLast=TRUE))>0,
"y","n")
# ID DATE TRAP RESULT
# 1 1 2013-01-01 1 y
# 2 2 2013-01-01 1 y
# 3 3 2013-01-01 1 y
# 4 1 2013-01-02 3 y
# 5 2 2013-01-01 2 n
# 6 3 2013-01-02 3 y
# 7 1 2013-01-03 2 n
# 8 2 2013-01-03 1 n
# 9 3 2013-01-03 3 n