我有一个数据集(train2),其中包含79个变量(数字和文本组合),而SalePrice作为最后一列。我正在尝试创建一个randomForest模型,这是我得到的错误:
Forest <- randomForest(SalePrice~., data = train2, na.action = TRUE)
Error in model.frame.default(formula = SalePrice ~ ., data = train2, na.action = TRUE) :
attempt to apply non-function
您知道我如何解决此错误吗?
答案 0 :(得分:0)
@joran是正确的。我也想引导您探索这两个方向:
ntree 要生长的树木数量。请勿将此数字设置得太小,以确保 每个输入行至少都会被预测几次。
mtry 在每个分组中随机抽取为候选变量的数量。注意 分类的默认值是不同的(sqrt(p),其中p是 x中的变量)和回归(p / 3)