分类中的神经网络用于较大的数据集

时间:2019-07-08 17:33:38

标签: r neural-network classification nnet

我正在尝试使用尖号执行神经网络来解决分类问题。我的数据集有94000行和5个变量(1个二进制因变量和4个独立变量)。我已经清理了数据并转换了必要的变量。没有丢失的数据。数据平衡。我正在使用使用插入符号的nnet进行交叉验证。现在,我在以下代码下运行:

model <- train(Output ~ Var1 + Var2 + Var3 + Var4, 
                          method = "nnet", 
                          data = my_data, verbose = FALSE, 
                          trControl=trainControl(method='repeatedcv', 
                                                 number = 10, 
                                                 repeats = 5,
                                                 verboseIter=FALSE), 
                          tuneGrid=expand.grid(.size=c(0,1,2,5,10,15), 
                                               .decay=c(0,0.001,0.01,0.1)))

您能告诉我如何进一步改善模型吗?

其他详细信息: 1.数据是金融市场数据。 2.预测后,我将使用Youden指数检查最佳阈值。因此,我将只为报告选择最佳阈值。

由于我是神经网络的新手,因此我正在寻求一些建议,以使用R改进模型以及可以使用哪种调整或其他模型。

1 个答案:

答案 0 :(得分:0)

显然,您的问题很广泛。在阅读代码和您发布的其他详细信息时,我想到的是一些想法和观察结果。

  1. 我认为评估神经元的零值是没有意义的 网络规模和重量衰减。
  2. 基于上述情况,您可以通过增加网格大小(主要是神经网络大小)来改善模型。

评论您正在使用金融市场数据不会为阅读器添加其他信息。您正在使用时间序列吗?您正在考虑哪种变量?您是通过回归还是分类来解决问题?