删除数据框中的重复数据

时间:2019-04-02 13:39:43

标签: r duplicates

我正在尝试删除此数据框中的重复项,我尝试了这三个命令,但是它不起作用。

这是我的数据表,这是我尝试的代码。

您能告诉我我犯的错误,并提供一种纠正该错误的方法 四个命令中没有一个给我结果。

第一个:

`jeu_donnees[!duplicated(jeu_donnees$id_requete.Width)`

第二个:

jeu_donnees=`unique(jeu_donnees,"id_requete",fromLast = FALSE)`

第三个:

jeu_donnees=`unique(jeu_donnees$id_requete)`

最后

`jeu_donnees[!duplicated(jeu_donnees$id_requete)]`

我希望输出一个具有唯一id_requete的数据帧。对于广场,他将保留一个请求并删除另一个请求

enter image description here

1 个答案:

答案 0 :(得分:0)

我认为您在使用duplicated()过滤数据框时只是想念逗号。 并且unique()给出唯一的ID,但不给出其索引,您可以使用match()找到首发事件的索引。 您可以尝试这样的事情:

# An example of reproductible dataframe with duplicated rows
data <- data.frame(id=letters[1:10], val=1:10, stringsAsFactors = FALSE)
data <- data[c(1:9, 1,1,3,10),]

# Solution with duplicated()
data[!duplicated(data$id),]

# Solution with unique() and match()
data[match(unique(data$id), data$id),]