标签: machine-learning deep-learning autoencoder
培训堆叠式自动编码器时,选择隐藏层数及其大小的最佳做法是什么?
例如,在堆栈的每一层中,最好将隐藏层大小设置为减去输入层大小吗?
此外,是否需要在堆栈中的每个层执行超参数优化(例如,L2权重正则化),或者堆栈中的一个位置的超参数是否倾向于为其他位置很好地推广?