c50算法只适用于分类数据集吗?

时间:2017-09-20 12:11:58

标签: r

我找到了一个带有R语言iris数据集的示例代码。 我想使用相同的代码,但使用其他只有数值的数据集(心脏病数据集)。这会起作用吗?

1 个答案:

答案 0 :(得分:0)

确保您的数据不包含缺失值。如果缺少值,则在模型构建阶段,编译器将引发错误。因此,如果缺少某些数据点,则可能应该尝试估算它们。

还要确保您的输出Variable / class变量本质上是Categorical的。 另外,如果其二进制分类问题和标签为0,1 确保将0和1编码为正确的文本标签,然后将其转换为因数。

将数字编码为分类数字的示例

    data$class  <-  ifelse(data$class==0,"not_found","found")
    data$class <- as.factor(data$class,levels=c("found","not_found))