怎么修 ”'。'在公式中,并且在使用randomForest函数时没有“数据”参数?

时间:2019-02-05 12:38:24

标签: r random-forest

我正在尝试用我的数据建立一个随机森林回归模型。对于第一个参数,我编写了公式,然后指定了数据,最后编写了所需树的数量。

rf_model = randomForest(targetVar ~., data = train, ntree = 50)

执行此行代码时遇到的错误是:

Error in terms.formula(formula, data = data) : 
'.' in formula and no 'data' argument

是什么导致错误?这是随机森林回归模型的非常简单明了的实现。另外,关于错误的阅读并没有屈服于任何有效的解决方案。

1 个答案:

答案 0 :(得分:0)

问题不在于randomForest函数。它与train数据集有关,以及如何指示randomForest处理它。

  1. 您必须指导randomForest()如何处理NA值。例如,您必须设置na.action=na.omit
  2. 您的数据集变量太多-randomForest抱怨53个变量太多。

因此,作为一个例子,我将向您展示如何使用2个变量。

train <- read.csv('<path to>/Train.csv', header=TRUE, sep = ",")
sales <- randomForest(Item_Outlet_Sales~Item_MRP+Item_Weight, data = train, ntree=50, na.action=na.omit)
sales

na.omit不是唯一可用的功能。请参阅文档以获取更多NA处理功能。

您必须查看要使用的变量。希望这会有所帮助。