我正在尝试删除此数据框中的重复项,我尝试了这三个命令,但是它不起作用。
这是我的数据表,这是我尝试的代码。
您能告诉我我犯的错误,并提供一种纠正该错误的方法 四个命令中没有一个给我结果。
第一个:
`jeu_donnees[!duplicated(jeu_donnees$id_requete.Width)`
第二个:
jeu_donnees=`unique(jeu_donnees,"id_requete",fromLast = FALSE)`
第三个:
jeu_donnees=`unique(jeu_donnees$id_requete)`
最后
`jeu_donnees[!duplicated(jeu_donnees$id_requete)]`
我希望输出一个具有唯一id_requete的数据帧。对于广场,他将保留一个请求并删除另一个请求
答案 0 :(得分:0)
我认为您在使用duplicated()
过滤数据框时只是想念逗号。
并且unique()
给出唯一的ID,但不给出其索引,您可以使用match()找到首发事件的索引。
您可以尝试这样的事情:
# An example of reproductible dataframe with duplicated rows
data <- data.frame(id=letters[1:10], val=1:10, stringsAsFactors = FALSE)
data <- data[c(1:9, 1,1,3,10),]
# Solution with duplicated()
data[!duplicated(data$id),]
# Solution with unique() and match()
data[match(unique(data$id), data$id),]