如何删除R中具有相同值的相邻行?

时间:2015-06-23 20:38:36

标签: r

我有一个巨大的数据框(日志),如下所示:

wordTar1    wordTar2
1   vital   vital
2   vital   raccoon
3   raccoon vital
4   vital   cerebrum
5   cerebrum    accumulates
6   accumulates accumulates
7   accumulates cerebrum
8   cerebrum    cerebrum
9   cerebrum    cerebrum

我需要做的是用重复的单词去掉相邻(水平)的行。基本上,这就是我需要的:

wordTar1    wordTar2
1   vital   raccoon
2   raccoon vital
3   vital   cerebrum
4   cerebrum    accumulates
5   accumulates cerebrum

3 个答案:

答案 0 :(得分:1)

如果数据框被称为data,则以下内容应该有效:

data[data[,"wordTar1"]!=data[,"wordTar2"],]

如果第一列中的字符与第二列中的字符不匹配,则返回TRUE并返回该行。

答案 1 :(得分:0)

尝试:

df1[df1$wordTar1!=df1$wordTar2,]

答案 2 :(得分:0)

正如其他人所说,你可以使用像

这样的东西

data <- data[data$wordTar1 != data$wordTar2,]

然后要查找所有唯一行,请使用unique,如:

data <- unique(data)