我目前正在尝试为CLDNN(卷积,LSTM,深度神经网络)提出一种新颖的结构
正如任何其他网络一样,我很难优化超参数。
我想尝试使用网格搜索和随机搜索来获得一组最佳的超参数,但我对一些事情并不清楚。
如果我使用一组临时超参数运行网络模拟,我该如何衡量超参数的“优点”?我考虑在每次模拟的N个时期之后记录成本和训练准确度。
由于每次模拟需要相对较长的时间(对于我的网络,需要大约70秒来训练一个纪元),有没有更快的方法来检查超参数的“优点”而不实际运行完整的训练?
是否有针对超参数优化的一般提示/建议?
答案 0 :(得分:1)