我正在尝试在R中编写一个单行代码,用于查找数据框中每个类的最高记录。我发现this excellent example mtcars()
使用了"cyl"
这种情况。
我将坚持使用相同的示例,即我的课程为"hp"
,并且我正在尝试使用列require(data.table)
d <- data.table(mtcars, key="cyl")
d[, head(.SD, 3), by=cyl]
的顶部值。
前一个问题给出的答案给出了前N个值&#34;通过头/尾功能。
mapToInt
我正在尝试使用百分比做同样的事情。例如每个班级的前80%hp行(按从最大到最小hp的顺序排列)。
有没有办法将百分比视角纳入上面的data.table函数?
答案 0 :(得分:3)
d <- d[order(cyl,-hp)]
d[,.SD[hp >= quantile(hp, 0.8)], by = cyl]
cyl mpg disp hp drat wt qsec vs am gear carb
1: 4 30.4 95.1 113 3.77 1.513 16.90 1 1 5 2
2: 4 21.4 121.0 109 4.11 2.780 18.60 1 1 4 2
3: 4 21.5 120.1 97 3.70 2.465 20.01 1 0 3 1
4: 6 19.7 145.0 175 3.62 2.770 15.50 0 1 5 6
5: 6 19.2 167.6 123 3.92 3.440 18.30 1 0 4 4
6: 6 17.8 167.6 123 3.92 3.440 18.90 1 0 4 4
7: 8 15.0 301.0 335 3.54 3.570 14.60 0 1 5 8
8: 8 15.8 351.0 264 4.22 3.170 14.50 0 1 5 4
9: 8 14.3 360.0 245 3.21 3.570 15.84 0 0 3 4
10: 8 13.3 350.0 245 3.73 3.840 15.41 0 0 3 4
或者使用dplyr:
library(dplyr)
d %>%
group_by(cyl) %>%
filter(hp >= quantile(hp, 0.8))