标签: machine-learning bayesian loss hyperparameters
我将贝叶斯优化与高斯过程结合使用来优化我的递归网络参数。
我得到了很好的结果。我返回最后一个时期的验证损失作为优化算法的反馈。
我真的很想在每次迭代的反馈中包含其他一些参数,例如例如训练持续时间和modell参数的数量,因为我想找到一个性能良好的小型模型,而无需将参数的值更改为较小的范围。 问题是我不知道损失的规模。如果仅将其他参数定为0到1之间的值,则损失始终在0.02-0.01范围内可能影响较小。在这种情况下,将选择最小的模型,但性能会很差。
感谢您的想法。干杯!