我想预测R中数据集中的值,但是这些值的格式类似于 <10和100-400和100+。它们属于哪一类,分类变量还是连续变量?
答案 0 :(得分:0)
如果您从头开始创建factor
,请参见以下示例:
vals <- c("100-400", "<100", "400+")
vector <- sample(vals, 20, replace = TRUE)
vector
ordered <- factor(vector, ordered = TRUE, levels = c("<100", "100-400", "400+"))
ordered
顺序取决于levels
参数中向量值的顺序。
如果您已有factor
变量,则想使用ordered()
函数:
factor1 <- factor(sample(vals, 20, replace=TRUE),
levels = c("400+", "<100", "100-400"))
factor1
factor1 <- ordered(factor1, levels = c("<100", "100-400", "400+"))
factor1
我希望这能回答您的问题。