我尝试使用之前的函数预测了几个模型,但是我得到了eval中的错误(expr,envir,enclos):object' var.1'找不到"。这很奇怪,因为var.1不在数据帧中。代码是:
library(randomForest)
library(ada)
library(class)
library(e1071)
library(rpart)
library(car)
library(nnet)
library(kknn)
Consenso <- function(DF,VAR.DEP){ #entries are a dataframe and a dependent var
N1 <- sample(DF,dim(DF)[1],replace=TRUE)
N2 <- sample(DF,dim(DF)[1],replace=TRUE)
N3 <- sample(DF,dim(DF)[1],replace=TRUE)
N4 <- sample(DF,dim(DF)[1],replace=TRUE)
N5 <- sample(DF,dim(DF)[1],replace=TRUE)
mod.kknn <- train.kknn(VAR.DEP ~.,data=N1,kmax=trunc(sqrt(dim(DF)[1])))
mod.net <- nnet(VAR.DEP ~ ., data = N2, size = 10, rang = 0.1,
decay = 5e-04, maxit = 400, trace = FALSE, MaxNWts = 20000)
mod.tree <- rpart(VAR.DEP ~ ., data = N3)
mod.sv <- svm(VAR.DEP ~ ., data = N4, kernel = "linear")
mod.rf <-randomForest(VAR.DEP ~.,data= N5,ntree=400)
lista.mod <- list("Modelo.kknn"=mod.kknn,"Modelo.Redes"=mod.net,"Modelo.Arboles"=mod.tree,"Modelo.SV"=mod.sv,"Modelo.RF"=mod.rf)
return(lista.mod)
}
#Using the function
pbiris <- Consenso(iris,iris$Species)
#Make a prediction
predict(pbiris$Modelo.kknn,iris)
#Error in eval(expr, envir, enclos) : object 'Sepal.Width.1' not found
#Var Sepal.Width.1 is not in the dataframe.
我做错了什么?
有什么建议吗? 感谢。
答案 0 :(得分:3)
很难确定,因为您的代码不是完全可重现性最低,但几乎可以肯定问题来自:
sample(DF, dim(DF)[1], rep=T)
问题是您正在对数据框的列进行采样,而不是行。考虑:
DF <- data.frame(a=1:4, b=5:8)
sample(DF, dim(DF)[1], rep=T)
产地:
b b.1 b.2 a
1 5 5 5 1
2 6 6 6 2
3 7 7 7 3
4 8 8 8 4
由于我们的数据框的列数少于行数,因此如果您尝试对列进行多次采样,则会多次重新采样相同的列。在我们的测试中,我们重新对列b
进行了三次重采样,因此我们得到b
,b.1
和b.2
。当然,您的原始数据框没有额外的列,因此您的predict
调用失败。
请记住,data.frame
个对象是列表,因此您只是对列表中的元素进行了采样。要对行进行抽样:
DF[sample(nrow(DF)), ]