用dplyr选择每个组中的最后一行很慢

时间:2019-02-15 06:55:17

标签: r performance dplyr

我有以下R代码。本质上,我要求R根据邮政编码和Paon排列数据集,然后按ID将它们分组,最后只在每个组中保留最后一行。但是,R需要3个多小时才能完成此操作。

我不确定我的代码在做什么错,因为这里没有for循环。

epc2是具有324,368行的向量。

epc3 <- epc2 %>%
  arrange(postcode, paon) %>% 
  group_by(id) %>% 
  do(tail(., 1)) 

感谢您提供的所有帮助。

1 个答案:

答案 0 :(得分:1)

怎么样:

mtcars %>% 
  arrange(cyl) %>% 
  group_by(cyl) %>% 
  slice(n())