对于不同的数据集,相同的CNN模型是否需要不同的学习率?

时间:2019-10-30 15:18:05

标签: deep-learning conv-neural-network image-segmentation tf.keras hyperparameters

我使用卷积神经网络模型进行医学图像分割。在训练模型(例如提拉米苏模型1)时,我尝试了与本文建议的学习率相同的学习率,但是结果却很糟糕。

我的担心是,当我们将模型用于不同的数据集时,是否需要找到不同的最佳学习率。例如,在这种情况下,他们使用CamVid数据集(街道,汽车,人等),而我使用的是医学图像。

1 个答案:

答案 0 :(得分:1)

虽然在大多数情况下可能有一些参数集可以很好地工作(通常最终是几个库的默认值),但最佳选择还是取决于数据集。使用论文中的那些是获得基准的一个很好的起点,但是绝对不要阻止您尝试更改它们。

另一个重要的一点是损失函数,该损失函数对于分割汽车可能很好用(它们很大,超过图像的20%),对于文本之类的东西(很小,少于图像的1%)可能不起作用)。

如果您进行了二进制分割,那么使用阈值来确定像素是否是您想要的类也很重要。