嗨,我一直在尝试将数字变量重新编码为分类变量。
例如,我尝试使用mtcars
将mpg
分为2类<25&=> 25
这些是我尝试过的代码,但收到错误消息。
data=mtcars
summary(mtcars$mpg)
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.40 15.43 19.20 20.09 22.80 33.90
mpgcat <- cut(mpg, breaks = (0,24.99,34), labels = c("0","1"))
错误:“ mpgcat <-cut(mpg,breaks =(0,”
答案 0 :(得分:2)
cut
将x
的范围划分为间隔,并根据x值落入的间隔对值进行编码。最左边的间隔对应于第一级,下一个最左边的对应于第二级,依此类推。
中断是两个或多个唯一切割点的数字矢量,或者是一个数字(大于或等于2),给出了x
所要进入的间隔数切。
因此,您需要一些脚本代码,例如:
data=mtcars
summary(mtcars$mpg)
mpgcut <- cut(mtcars$mpg, breaks = c(0,24.99,34), labels = c("0","1"))
mpgcut
获得这样的结果:
[1] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 1 1 1 0 0 0 0
Levels: 0 1