神经网络的数据化

时间:2017-03-21 17:34:52

标签: machine-learning neural-network data-science

我有想要处理的图片。从这些图像中提取第一个特征,然后将这些特征输入神经网络进行训练。我虽然没有很多图像,但想生成更多数据。

1)产生过度拟合的原因是什么:我应该从原始图像生成更多图像,然后用它们提供整个管道,还是应该为提取的特征带来变化,然后用这种方式训练神经网络中的更多数据? / p>

第二种方法在计算上更便宜,但产生更好的结果?

2)对于生成更多数据(更多图像或更多图像),尝试了哪些技术?

1 个答案:

答案 0 :(得分:0)

当您没有足够的数据时,您的模型的性能可能会很差。所以你必须尝试一些事情:

  1. 您可以修改已应用翻译,轮播等的数据;例如,将图像的所有像素向左移动几个像素。这是对图像的操作。
  2. 您还可以通过生成模型生成更多图像:受限制的玻尔兹曼机器,深信仰网络等。
  3. 您还可以确定是否需要更多培训数据。在坐标轴中绘制训练数据和验证数据的分数。在 x 轴中,集合的大小(所有集合的10%,所有集合的20%,...,所有集合的90%)和 y 轴是得分。然后你看看图表。为了更好地理解我所说的我强烈推荐机器学习的Andrew Ng(https://www.coursera.org/learn/machine-learning)的视频,特别是第6周(应用机器学习的建议)