Question

我有一个巨大的数据框（日志），如下所示：

wordTar1    wordTar2
1   vital   vital
2   vital   raccoon
3   raccoon vital
4   vital   cerebrum
5   cerebrum    accumulates
6   accumulates accumulates
7   accumulates cerebrum
8   cerebrum    cerebrum
9   cerebrum    cerebrum

我需要做的是用重复的单词去掉相邻（水平）的行。基本上，这就是我需要的：

wordTar1    wordTar2
1   vital   raccoon
2   raccoon vital
3   vital   cerebrum
4   cerebrum    accumulates
5   accumulates cerebrum

Answer 1

如果数据框被称为data，则以下内容应该有效：

data[data[,"wordTar1"]!=data[,"wordTar2"],]

如果第一列中的字符与第二列中的字符不匹配，则返回TRUE并返回该行。

Answer 2

尝试：

df1[df1$wordTar1!=df1$wordTar2,]

Answer 3

正如其他人所说，你可以使用像

这样的东西

data <- data[data$wordTar1 != data$wordTar2,]

然后要查找所有唯一行，请使用unique，如：

data <- unique(data)

如何删除R中具有相同值的相邻行？

3 个答案: