假设您有数据集
Name Color Response
1 Red No
2 Blue No
3 Green Yes
4 Blue Yes
5 Blue No
6 Red No
7 Red Yes
8 Green No
我要弄清楚的是,如果有30种不同的颜色,其中10种显示10次,而其他20种仅显示2-3次,有没有办法删除所有没有的行足够的值。因此,对于上面说的数据集,我们只希望显示3次的变量,我们将获得类似于
的结果Name Color Response
1 Red No
2 Blue No
3 Blue Yes
4 Blue No
5 Red No
6 Red Yes
下面的代码是针对一种特定颜色的,但是我想将其应用于所有颜色而不必编写20次。
A4 <- A3[ A3$Color !="Green",, drop=FALSE]
A4$Color <- factor(A4$Color)
我不想对数据进行子集化,我需要将整个数据集保持在一起,只删除那些显示值不够的行。预先感谢!