删除数据框中大于95百分位数的数据

时间:2012-09-20 19:30:42

标签: r

我有这样的数据:

DF:

Group   Point
A       6000
B       5000
C       1000
D        100
F        70

在我绘制这个df之前,我只想删除数据框中超过95%的值。任何人都告诉我该怎么做?

2 个答案:

答案 0 :(得分:36)

使用quantile功能

> quantile(d$Point, 0.95)
 95% 
5800 

> d[d$Point < quantile(d$Point, 0.95), ]
  Group Point
2     B  5000
3     C  1000
4     D   100
5     F    70

答案 1 :(得分:5)

或使用&#39; dplyr&#39;库:

> quantile(d$Point, 0.95)
 95% 
5800

> df %>% filter(Point < quantile(df$Point, 0.95))
  Group Point
1     B  5000
2     C  1000
3     D   100
4     F    70