我有一个巨大的数据框(日志),如下所示:
wordTar1 wordTar2
1 vital vital
2 vital raccoon
3 raccoon vital
4 vital cerebrum
5 cerebrum accumulates
6 accumulates accumulates
7 accumulates cerebrum
8 cerebrum cerebrum
9 cerebrum cerebrum
我需要做的是用重复的单词去掉相邻(水平)的行。基本上,这就是我需要的:
wordTar1 wordTar2
1 vital raccoon
2 raccoon vital
3 vital cerebrum
4 cerebrum accumulates
5 accumulates cerebrum
答案 0 :(得分:1)
如果数据框被称为data
,则以下内容应该有效:
data[data[,"wordTar1"]!=data[,"wordTar2"],]
如果第一列中的字符与第二列中的字符不匹配,则返回TRUE
并返回该行。
答案 1 :(得分:0)
尝试:
df1[df1$wordTar1!=df1$wordTar2,]
答案 2 :(得分:0)
正如其他人所说,你可以使用像
这样的东西 data <- data[data$wordTar1 != data$wordTar2,]
然后要查找所有唯一行,请使用unique
,如:
data <- unique(data)