在R中的数据集中处理类似(“ <10”,“ 100- 400”,“ 100+”)的值

时间:2018-07-22 14:51:57

标签: r data-manipulation

我想预测R中数据集中的值,但是这些值的格式类似于  <10和100-400和100+。它们属于哪一类,分类变量还是连续变量?

1 个答案:

答案 0 :(得分:0)

如果您从头开始创建factor,请参见以下示例:

vals <- c("100-400", "<100", "400+")

vector <- sample(vals, 20, replace = TRUE)
vector

ordered <- factor(vector, ordered = TRUE, levels = c("<100", "100-400", "400+"))
ordered

顺序取决于levels参数中向量值的顺序。

如果您已有factor变量,则想使用ordered()函数:

factor1 <- factor(sample(vals, 20, replace=TRUE),
                  levels = c("400+", "<100", "100-400"))
factor1

factor1 <- ordered(factor1, levels = c("<100", "100-400", "400+"))
factor1

我希望这能回答您的问题。