我有3列的数据集。
price
Factor (numeric var 1-15 categories)
group (string (100 categories))
我需要为每个因子类别选择只有观察超过五个的这些组!怎么做?
这不正确!
new<-city[(city$group)>5,]
答案 0 :(得分:3)
我们可以使用data.table
执行此操作。转换&#39; data.frame&#39; to&#39; data.table&#39;,按&#39;分组&#39;&#39; group&#39;,获取Data.table的子集(.SD
)所在的数量行大于5(.N >5
)
library(data.table)
setDT(city)[, .SD[.N >5], by = .(Factor, group)]