获得每个班级的前80%

时间:2018-06-11 03:47:55

标签: r class sorting data.table percentile

我正在尝试在R中编写一个单行代码,用于查找数据框中每个类的最高记录。我发现this excellent example mtcars()使用了"cyl"这种情况。

我将坚持使用相同的示例,即我的课程为"hp",并且我正在尝试使用列require(data.table) d <- data.table(mtcars, key="cyl") d[, head(.SD, 3), by=cyl] 的顶部值。

前一个问题给出的答案给出了前N个值&#34;通过头/尾功能。

mapToInt

我正在尝试使用百分比做同样的事情。例如每个班级的前80%hp行(按从最大到最小hp的顺序排列)。

有没有办法将百分比视角纳入上面的data.table函数?

1 个答案:

答案 0 :(得分:3)

d <- d[order(cyl,-hp)]
d[,.SD[hp >= quantile(hp, 0.8)], by = cyl]


    cyl  mpg  disp  hp drat    wt  qsec vs am gear carb
 1:   4 30.4  95.1 113 3.77 1.513 16.90  1  1    5    2
 2:   4 21.4 121.0 109 4.11 2.780 18.60  1  1    4    2
 3:   4 21.5 120.1  97 3.70 2.465 20.01  1  0    3    1
 4:   6 19.7 145.0 175 3.62 2.770 15.50  0  1    5    6
 5:   6 19.2 167.6 123 3.92 3.440 18.30  1  0    4    4
 6:   6 17.8 167.6 123 3.92 3.440 18.90  1  0    4    4
 7:   8 15.0 301.0 335 3.54 3.570 14.60  0  1    5    8
 8:   8 15.8 351.0 264 4.22 3.170 14.50  0  1    5    4
 9:   8 14.3 360.0 245 3.21 3.570 15.84  0  0    3    4
10:   8 13.3 350.0 245 3.73 3.840 15.41  0  0    3    4

或者使用dplyr:

library(dplyr)
d %>% 
  group_by(cyl) %>% 
  filter(hp >= quantile(hp, 0.8))