如何使用CARET包评估多个模型?

时间:2015-08-05 15:05:24

标签: r neural-network r-caret nnet

我想使用CARETnnet包来预测泰坦尼克号数据集的生存/死亡。我想安装20个神经网络,每个网络有1个隐藏节点,2个隐藏节点,...... 20个隐藏节点。通常,CARET包将根据训练数据选择最佳模型,但我想采用20个网络中的每一个并将它们中的每一个应用于测试数据。如何保存每个模型以便根据测试数据集进行测试? CARET包中有一种方法可以提供帮助吗?

1 个答案:

答案 0 :(得分:3)

不是直接,不是,但它应该是可能的。您需要修改fit函数以将其保存到文件中。在fit函数内部,您将知道调整参数值,但不知道构建模型的重采样。

以下是一个如何实现此目的的示例,该答案来自very similar question的答案。

# Copy all model structure info from existing model type
cust.mdl <- getModelInfo("rf", regex=FALSE)[[1]]

# Override fit function so that we can save the iteration
cust.mdl$fit <- function(x=x, y=y, wts=wts, param=param, lev=lev, last=last, classProbs=classProbs, ...) {
  # Dont save the final pass (dont train the final model across the entire training set)
  if(last == TRUE) return(NULL) 

  # Fit the model
  fit.obj <- getModelInfo("rf", regex=FALSE)[[1]]$fit(x, y, wts, param, lev, last, classProbs, ...)

  # Create an object with data to save and save it
  fit.data <- list(resample=rownames(x),
                   mdl=fit.obj,
                   #x, y, wts,
                   param=param, lev=lev, last=last, classProbs=classProbs, 
                   other=list(...))

  # Create a string representing the tuning params
  param.str <- paste(lapply(1:ncol(param), function(x) {
                     paste0(names(param)[x], param[1,x])
                    }), collapse="-")

  save(fit.data, file=paste0("rf_modeliter_", sample(1000:9999,1), "_", param.str, ".RData"))
  return (fit.obj)
}