Question

我目前正在尝试将数据分组到较小的尺寸，并且我对编码部分有疑问，因为我是一个完整的编码新手。

我试图在这里删除所有具有相同条目的行。所以代码应该在第3列和第34列中消除所有具有相同变量的行;变量2＆＃34;例如。复制函数只是用＆＃34; 0＆＃34;去除第二个条目，但是我想用＆＃34; 0＆＃34;去掉两个条目。

Answer 1

您可以使用dplyr库来执行数据操作。它是一个整洁的图书馆，非常有帮助。我想出了以下代码来解决您的问题。假设数据帧存储在名为data_frame的变量中，解决方案如下

data_frame <- tbl_df(data_frame) %>%
              group_by(var2) %>%
              filter(n()==1)

我将结果存储在同一个变量中。您可以使用另一个变量名来保持原始数据框完整

Answer 2

这里我们使用table来查看哪些值是重复的，然后在所有值中搜索那些没有重复的值。

df = table(data$Var2)
data[!data$Var2 %in% as.numeric(names(df[df > 1])), ]

Answer 3

我们还可以duplicated添加fromLast=TRUE以删除所有重复的行。

df1[with(df1, !(duplicated(var2)|duplicated(var2, fromLast=TRUE)),]