我想使用R建立随机森林模型。我有4000多个变量。是否有一种简单的方法来输入变量,而无需在语法中键入每个变量?还是有另一种方法可以减少候选变量的数量而无需在每个变量中键入?我来自SAS世界,在那里我可以编写一个宏来保存变量名称。
答案 0 :(得分:0)
正如Marius所指出的,您可以在公式中使用.
来在模型中包括所有解释变量。请参见下面的代码:
library(randomForest)
data(mtcars)
randomForest(mpg ~ ., mtcars, keep.forest = FALSE, ntree = 100)
输出:
Call:
randomForest(formula = mpg ~ ., data = mtcars, keep.forest = FALSE, ntree = 100)
Type of random forest: regression
Number of trees: 100
No. of variables tried at each split: 3
Mean of squared residuals: 6.39198
% Var explained: 81.84