我需要进行数据验证,以确定CodeA1,CodeA2和Code A3(列)中是否有任何重复项。
CodeA1 CodeA2 CodeA3
1 1 NA 5
2 3 1 3
3 8 3 3
4 3 NA NA
5 4 1 2
6 1 8 3
所有列中的行(CodeA1,CodeA2,CodeA3)应该是唯一的。
有人可以帮R吗?
我想识别所有行的重复项,结果如下
CodeA1 CodeA2 CodeA3 Duplicate
1 1 NA 5 No
2 3 1 3 Yes
3 8 3 3 Yes
4 3 NA NA No
5 4 1 2 No
6 1 8 3 No
答案 0 :(得分:5)
可能的解决方案是:
dtset$Duplicate <- apply(dtset,1,function(x) any(table(x)>1))
dtset
########
CodeA1 CodeA2 CodeA3 Duplicate
1 1 NA 5 FALSE
2 3 1 3 TRUE
3 8 3 3 TRUE
4 3 NA NA FALSE
5 4 1 2 FALSE
6 1 8 3 FALSE