randomForest需要至少两个类来做分类

时间:2014-08-20 03:40:05

标签: classification random-forest

我有一个数据集Data_Model,我想在“response”变量上构建一个分类器。我先做了以下几点:

D<-Data_Model

D$response<-factor(D$response,levels = c(0,1))

然后我跑了:

FOREST_model <- randomForest(response~., data=D, ntree=3000,na.action=na.omit) 我收到以下错误:

**Error in randomForest.default(m, y, ...) : Need at least two classes to do classification.**

但是,如果我检查“响应”中的级别,则有两个级别:

table(D$response,exclude = NULL) 0 1 <NA> 11401 5612 0

如果我这样做:

class(str(D$response)) Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...

任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:2)

我自己得到了,问题不是'响应',问题是几个列有很多缺失值(或所有缺失的值),在删除它们之后,它起作用了。