我目前正在尝试将数据分组到较小的尺寸,并且我对编码部分有疑问,因为我是一个完整的编码新手。
我试图在这里删除所有具有相同条目的行。所以代码应该在第3列和第34列中消除所有具有相同变量的行;变量2"例如。复制函数只是用" 0"去除第二个条目,但是我想用" 0"去掉两个条目。
答案 0 :(得分:1)
您可以使用dplyr库来执行数据操作。它是一个整洁的图书馆,非常有帮助。我想出了以下代码来解决您的问题。假设数据帧存储在名为data_frame的变量中,解决方案如下
data_frame <- tbl_df(data_frame) %>%
group_by(var2) %>%
filter(n()==1)
我将结果存储在同一个变量中。您可以使用另一个变量名来保持原始数据框完整
答案 1 :(得分:0)
这里我们使用table来查看哪些值是重复的,然后在所有值中搜索那些没有重复的值。
df = table(data$Var2)
data[!data$Var2 %in% as.numeric(names(df[df > 1])), ]
答案 2 :(得分:0)
我们还可以duplicated
添加fromLast=TRUE
以删除所有重复的行。
df1[with(df1, !(duplicated(var2)|duplicated(var2, fromLast=TRUE)),]