我正在寻找一种方法来检测重复的内容集。
因此,对于列中的一组 n 索引( V2 )(选择 n = 3来说明):
V1 V2
A Hello
B How are you
C Fine
应符合:
V1 V2
D Hello
E How are you
F Fine
但不:
V1 V2
G Hello
H How are you
I Crappy
理想情况下,我要查找的返回值应包括:
对于选定的集合长度n,具有重复项的单元格的内容和
与每个重复集的第一个元素相关联的rownames或索引
所以,一组至少 3个单元格的第一个实例,其内容和顺序在数据框的其他地方有重复:
V1 V2
A Hello
B How are you
C Fine
以及包含重复序列的第一行的索引或rowname:
V1
D
答案 0 :(得分:0)
您期待什么样的结果?
这有帮助吗?
V1 <- c("A", "B", "C")
V2 <- c("Hello", "How are you", "Fine")
data_1 <- cbind(V1,V2)
V1 <- c("D", "E", "F")
V2 <- c("Hello", "How are you", "Fine")
data_2 <- cbind(V1,V2)
if (data_1[1,2] == data_2[1,2] & data_1[2,2] == data_2[2,2] &
data_1[3,2] == data_2[3,2]){
TRUE
}else{
FALSE
}