我正在尝试用我的数据建立一个随机森林回归模型。对于第一个参数,我编写了公式,然后指定了数据,最后编写了所需树的数量。
rf_model = randomForest(targetVar ~., data = train, ntree = 50)
执行此行代码时遇到的错误是:
Error in terms.formula(formula, data = data) :
'.' in formula and no 'data' argument
是什么导致错误?这是随机森林回归模型的非常简单明了的实现。另外,关于错误的阅读并没有屈服于任何有效的解决方案。
答案 0 :(得分:0)
问题不在于randomForest
函数。它与train
数据集有关,以及如何指示randomForest
处理它。
randomForest()
如何处理NA
值。例如,您必须设置na.action=na.omit
。因此,作为一个例子,我将向您展示如何使用2个变量。
train <- read.csv('<path to>/Train.csv', header=TRUE, sep = ",")
sales <- randomForest(Item_Outlet_Sales~Item_MRP+Item_Weight, data = train, ntree=50, na.action=na.omit)
sales
na.omit
不是唯一可用的功能。请参阅文档以获取更多NA处理功能。
您必须查看要使用的变量。希望这会有所帮助。