修剪如何适应学习率?

时间:2019-08-11 06:48:17

标签: optuna

该问题的背景是通过运行study.optimize()并启用默认修剪并以学习率作为参数来优化神经网络训练的超参数(该问题可以推广到其他超参数)。

高学习率最初可以在每个中间步骤上降低损失,但最终结果不佳。

低学习率可能会产生较差的初始结果,但最终价值会更高。

启用修剪的

会不会因为中间结果差而修剪低学习率?这意味着最终的最佳参数会被错误地选择?

如何解决? 将使用另一个修剪器帮助吗? 谢谢!

1 个答案:

答案 0 :(得分:0)

我认为,保护那些显示出较低的初始评分但具有较高的最终评分(如晚花期)的试验仍然是一个悬而未决的问题。如您所述,现有的修剪器(例如MedianPruner)倾向于修剪此类较晚的开花器。

一种可能的解决方案是学习曲线预测,这是一项根据中间分数估算最终分数的任务。如果预测者成功估算了最终得分,我们可以创建修剪器以保护后期开花。我期待学习曲线预测的研究进展。