-如何排除列中的条件重复?

时间:2019-04-04 17:51:15

标签: r

我要删除重复少于5次的数据框注释列...

我正在new_frame中查看遗忘的频率和构成该列的组的数量,但是我希望这在我的df原件中发生。

使用此命令后,我将通过检查备注计数来检查,继续显示少于5次的组合,并弄乱所有信息..

df1<-df[!(df$X<5),]

check <- data.frame(table(df1$X))
check[check$Freq < 5,]

最后,我想删除所有少于5个的观察结果,请问有人可以帮助我吗?

问题是,对于相同的动物,我通过串联5个其他df列在X列中具有不同的值。在X列中,我有这种类型的组合(动物1 =列x = 1 10 2014 1 19,同一只动物1 =列x = 1 10 2015 1 18)。我想清理那些在X列中重复少于5次的组合中的动物)我无法重现您只是向我展示的组和频率。我有12.7万条信息,当我计算基于X列的分组时,我得到970个组,清洗(<5个)后,我得到700个组合,重复次数超过5次……我只想呆在那些X列这700个组合中的一部分...我不知道我能否解释清楚,对不起.. 如果可以帮助我,我很麻烦##

1 个答案:

答案 0 :(得分:0)

这应该做到。获得频率表后,您可以提取频率<5的值,然后使用%in%仅保留原始df中与这些名称匹配的那些值。

df[df$X %in% check$Var1[check$Freq < 5], ]