我从数据框中选择具有重复项的行及其重复项。 结果数据帧的一个例子可以是
df <- data.frame(ID = seq(1,10), A = rep(0,10), B = rep(seq(1,2),5), C = c(rep(1,5), rep(2,5)))
df$A[c(1,3,10)]<-1
从这个df我想要
1)创建一个新列,其中索引不同的重复组(例如(A,B,A ...)或(1.1,2.1,1.2 ......)
2)删除/选择所有重复的行而不删除A!= 0的行 在示例中,我应该保留ID为1,2,3,7,10
的行我试过了
subset(df, !duplicated(df[c(3,4)]) | df$A==1)
但由于排序,这会保留更多行(ID = 6)。
谢谢!