R:在列中查找重复的单元格集

时间:2017-12-01 15:43:40

标签: r duplicates subset

我正在寻找一种方法来检测重复的内容集。

因此,对于列中的一组 n 索引( V2 )(选择 n = 3来说明):

V1     V2
A      Hello
B      How are you
C      Fine

应符合:

V1     V2
D      Hello
E      How are you
F      Fine

V1     V2
G      Hello
H      How are you
I      Crappy

理想情况下,我要查找的返回值应包括:

  1. 对于选定的集合长度n,具有重复项的单元格的内容和

  2. 与每个重复集的第一个元素相关联的rownames或索引

  3. 所以,一组至少 3个单元格的第一个实例,其内容和顺序在数据框的其他地方有重复:

    V1     V2
    A      Hello
    B      How are you
    C      Fine
    

    以及包含重复序列的第一行的索引或rowname:

    V1
    D
    

1 个答案:

答案 0 :(得分:0)

您期待什么样的结果?

这有帮助吗?

 V1 <- c("A", "B", "C")
 V2 <- c("Hello", "How are you", "Fine")
 data_1 <- cbind(V1,V2)

 V1 <- c("D", "E", "F")
 V2 <- c("Hello", "How are you", "Fine")
 data_2 <- cbind(V1,V2)


 if (data_1[1,2] == data_2[1,2] & data_1[2,2] == data_2[2,2] & 
     data_1[3,2] == data_2[3,2]){
   TRUE
 }else{
   FALSE
 }