为什么使用randomForest获得负%var

时间:2018-07-16 17:05:58

标签: r

我正在尝试使用randomForest为R中的数据集拟合回归模型。我的数据集包含17个分类自变量和8个数字自变量。因变量是数字。这是我的r脚本:

#view data structure
str(my.data2)


#Partition data to train and test
ind<-sample(2,nrow(my.data2),replace = TRUE, prob=c(0.8,0.2))
train <- my.data2[ind==1,]
test <- my.data2[ind==2,]

#Fitting the Random Forest Regression Model to the dataset
install.packages("randomForest")
library(randomForest)
set.seed(123)
regressor = randomForest(x = my.data2[1],
                     y = my.data2$`GPS Utilization Rate`,
                     ntree = 100)

这是我得到的结果,有人可以帮助我理解为什么我得到负%var的解释吗?是否应该将所有类别变量更改为要分解的因子?谢谢大家的建议,我该如何改善模型!

  

回归器

Call:
 randomForest(x = my.data2[1], y = my.data2$`GPS Utilization Rate`,         ntree = 100) 
           Type of random forest: regression
                 Number of trees: 100
No. of variables tried at each split: 1

      Mean of squared residuals: 0.03384334
                % Var explained: -0.09

0 个答案:

没有答案