根据另一个变量

时间:2016-03-03 18:58:39

标签: r recode

我有一个数据库,其变量是分类的,并且有大量的类别。

我希望在这种情况下以较少的类别对其进行重新分类2,并根据它们对另一个变量的平均值将一个类别放在一个新类别中。

当我的类别数量较少(在本例中为10)时,我使用此脚本

data$V152=as.numeric(data$V152)

data$V152=as.numeric(revalue(as.character(data$V152),
           c("2"="0","3"="1", "4"="0","5"="1","6"="1","7"="0", "8"="0","9"="0","10"="0")))

但是我如何使用具有大量类别的分类呢?

查看图片我希望将带有平均值的类别重新分类为1,其他类别为2。

Boxplots of categories

0 个答案:

没有答案