验证重复的行/列

时间:2017-06-05 10:57:13

标签: r validation duplicates

我需要进行数据验证,以确定CodeA1,CodeA2和Code A3(列)中是否有任何重复项。

  CodeA1 CodeA2 CodeA3  
1   1     NA      5     
2   3     1       3     
3   8     3       3     
4   3     NA      NA     
5   4     1       2     
6   1     8       3     

所有列中的行(CodeA1,CodeA2,CodeA3)应该是唯一的。

有人可以帮R吗?

我想识别所有行的重复项,结果如下

  CodeA1 CodeA2 CodeA3  Duplicate
1   1     NA       5    No
2   3     1       3     Yes
3   8     3       3     Yes
4   3     NA      NA     No
5   4     1       2     No
6   1     8       3     No

1 个答案:

答案 0 :(得分:5)

可能的解决方案是:

dtset$Duplicate <- apply(dtset,1,function(x) any(table(x)>1))

dtset

########
  CodeA1 CodeA2 CodeA3 Duplicate
1      1     NA      5     FALSE
2      3      1      3      TRUE
3      8      3      3      TRUE
4      3     NA     NA     FALSE
5      4      1      2     FALSE
6      1      8      3     FALSE