如何选择有超过5个观测值的群组

时间:2017-06-27 12:20:37

标签: r

我有3列的数据集。

price
Factor (numeric var 1-15 categories)
group (string (100 categories))

我需要为每个因子类别选择只有观察超过五个的这些组!怎么做?

这不正确!

new<-city[(city$group)>5,]

1 个答案:

答案 0 :(得分:3)

我们可以使用data.table执行此操作。转换&#39; data.frame&#39; to&#39; data.table&#39;,按&#39;分组&#39;&#39; group&#39;,获取Data.table的子集(.SD)所在的数量行大于5(.N >5

library(data.table)
setDT(city)[, .SD[.N >5], by = .(Factor, group)]