假设我有一个数据框:
t <- data.frame(d1=c( 694, 695, 696, 2243, 2244, 2651, 2652 ),
d2=c(1.80950881, 1.80951007, 1.80951052, 1.46499982, 1.46500087, 1.14381419, 1.14381319 ))
d1 d2
1 694 1.809509
2 695 1.809510
3 696 1.809511
4 2243 1.465000
5 2244 1.465001
6 2651 1.143814
7 2652 1.143813
我希望按列d2
分组具有非常接近但不完全相等的值的实数值。因此,在这个例子中,在聚合之后,我想获得以下数据集:
d1 d2
1 694 1.809509
2 2243 1.465000
3 2652 1.143813
从每个组中获取最小d2
值的行。
使用aggregate
功能,我的第一次尝试:
aggregate(t, by=list(t$d2), FUN=min)
Group.1 d1 d2
1 1.143813 2652 1.143813
2 1.143814 2651 1.143814
3 1.465000 2243 1.465000
4 1.465001 2244 1.465001
5 1.809509 694 1.809509
6 1.809510 695 1.809510
7 1.809511 696 1.809511
远未实现我的目标。
我怎样才能告诉aggregate
不是通过完全相等来分组,而是通过提供容错的相等性来分组?
答案 0 :(得分:1)
这项工作与你的玩具数据我不知道真实的,你可能需要四舍五入到更多或更少的数字
aggregate(t, by=list(round(t$d2,4)), FUN=min)
答案 1 :(得分:1)
以下是tidyverse的方法:
library(tidyverse)
t %>%
group_by(round(d2, 1)) %>% #group by rounded d2
filter(d2 == min(d2)) %>% #filter min d1 in each group
ungroup() %>% #ungroup so you can remove the grouping column
select(-3)