我有以下数据集:
X v1 v2 class
1 12 10 A
2 11 13 B
3 14 15 A
我有两个A类对象和一个B类对象。我需要做的是采用这个矩阵并删除观察数量不符合阈值要求的所有类。如果我的Threshold-Count = 2,我希望得到以下结果:
X v1 v2 class
1 12 10 A
3 14 15 A
我怎样才能在R中实现这个目标?
答案 0 :(得分:3)
您可以使用table
例如:
tt <- table(dat$class)
dat[dat$class %in% names(tt[tt==threshold ]),]
例如:
dat <- read.table(text='X v1 v2 class
1 12 10 A
2 11 13 B
3 14 15 A',header=TRUE)
threshold <- 2
tt <- table(dat$class)
dat[dat$class %in% names(tt[tt==threshold]),]