如何解决caffe

时间:2017-05-09 08:43:00

标签: deep-learning caffe

我在caffe中有一个完全卷积网络(特别是堆叠的沙漏网络)。在每个卷积层之后,我有一个批量标准化和一个比例图层和一个ReLU图层。但是,我遇到了过度拟合的问题。通常,我会增加我的数据集(这是不可能的)或者我会使用Dropout图层,但是因为我已经读过在完全卷积网络中使用Dropout图层没有用,所以我不知道如何解决这个问题。除了我提到的,还有什么可做的。在这种情况下,规范化可能会有所帮助吗?

1 个答案:

答案 0 :(得分:2)

这是我从互联网上偷走的一张图片。当您的深度学习模型出现问题时,这是一个方便的事物图表。你说你听说过Dropout在Conv中并不好,但你有没有测试过它?从那开始,然后继续:

  1. 向具有接近输出
  2. 的较大深度维度的Conv图层添加dropout
  3. 尝试不深入。这与深入相反,您应该在深入之前尝试。确保你有一个不会过度首先的简单模型,然后尝试添加图层。
  4. 如果你仍然过度拟合并且辍学,那么尝试通过使你以后的Conv图层没有那么多的深度去除神经元
  5. 做Z.Kal所说的,通过改造它来乘以你的数据集。
  6. 如果所有这些都没有区别,那么接受你的架构可能是错误的这一事实。你深深埋藏在它里面,它可以存储你所提供的所有数据,而不会一概而论。考虑制作一个挤压点,在这里你有一个与输入数据相比较小的图层。
  7. enter image description here