h2o autoencoder错误在测试数据上呈现积极趋势

时间:2018-03-21 18:43:56

标签: deep-learning h2o autoencoder

我使用H2o和R来训练使用h2o.deeplearning的自动编码器。我用于拟合模型的训练数据是10000x1000,因此存在过度拟合的可能性(因为每个变量只有10个数据案例)。训练自动编码器的目的是检测测试数据中的异常值。

我所发现的是训练数据的合理表现(MSE~0.015),但测试数据的误差呈上升趋势。

enter image description here

我已经尝试了dropout和l1 / l2正则化参数,试图概括学习(没有模型过于精确地记忆输入数据)。我有:

anomaly_model <- h2o.deeplearning(
x = colnames(obs_h2o),
training_frame = obs_h2o,
activation = "RectifierWithDropout", 
autoencoder = TRUE,
hidden = c(100),   
reproducible = FALSE,  
standardize = TRUE,
seed = 7,
mini_batch_size = 2,
epochs = 10,          # number of times whole dataset is iterated
input_dropout_ratio   = 0.3,
hidden_dropout_ratios = 0.9,
average_activation    = 1.9,
sparse = TRUE,   
l2 = 1e-3
)

我尝试过调整参数,但测试数据随时间的误差增加仍然存在。

有关这种奇怪事件的任何想法?

0 个答案:

没有答案