我有一个数据库,其变量是分类的,并且有大量的类别。
我希望在这种情况下以较少的类别对其进行重新分类2,并根据它们对另一个变量的平均值将一个类别放在一个新类别中。
当我的类别数量较少(在本例中为10)时,我使用此脚本
data$V152=as.numeric(data$V152)
data$V152=as.numeric(revalue(as.character(data$V152),
c("2"="0","3"="1", "4"="0","5"="1","6"="1","7"="0", "8"="0","9"="0","10"="0")))
但是我如何使用具有大量类别的分类呢?
查看图片我希望将带有平均值的类别重新分类为1,其他类别为2。