标签: r dplyr
我有一个包含几列的数据框:order_id,amount,date和state。我总共有5万个观察结果。 我想删除订单数量较少的州,例如<50。 我知道如何找到我感兴趣的州:
order_id
amount
date
state
df %>% group_by(state) %>% summarize(counter=n()) %>% arrange(desc(counter))
,这向我显示了订单最多的州。 但是我不知道如何更改数据框,以使其仅包含具有50个订单的状态。
谢谢!