如果我有重复行的数据框,我们可以使用duplicated
进行查找。看到这里:
a <- c(rep("A", 3))
b <- c("B", "B","C")
df <-data.frame(a,b, stringsAsFactors = F)
df
a b
1 A B
2 A B
3 A C
duplicated(df)
FALSE TRUE FALSE
第1行和第2行相同。但是我需要的是一个函数,该函数告诉我两个(或更多)列包含相同的元素,而不管它们的顺序如何。这样的df可能看起来像这样:
df[2, ] <- df[2, 2:1]
df
a b
1 A B
2 B A
3 A C
如果我们不在乎订单行1和2仍然相同,因为它们都具有A和B。所以我的预期输出是后一个df:
magicfunction(df)
FALSE TRUE FALSE