我正在从卫星图像中提取道路网络。在此,像素分类是二进制的(0 =非道路,1 =道路)。因此,完整的6400 x 6400像素卫星图像的遮罩显示了一条大型道路网络,其中每条道路都连接到另一条道路。为了实现U-net,我将大图像分为625 x 256像素的625张图像。
我的问题是:神经网络是否可以更容易地找到批量大小增加的结构(因此可以找到不同批次之间的结构),还是只能在输入图像大小放大的情况下找到结构?
答案 0 :(得分:1)
如果您的模型是常规的卷积网络(没有任何怪异的hack),则一批中的样本将不会相互连接。
根据您使用的损失函数,批次大小可能也很重要。对于常规函数(可用的“ mse”,“ binary_crossentropy”,“ categorical_crossentropy”等),它们都使样本彼此独立。但是有些损失可能会考虑整个批次。 (例如F1指标)。如果您使用的损失函数不能独立处理样品,那么批次大小非常重要。
也就是说,批量越大,网络越容易找到路,因为一个图像可能会将权重推向一个方向,而另一幅图像可能会将权重推向另一个方向。然后,该批次中所有图像的平均结果应更能代表总体重量更新。
现在,进入一个实验领域(在测试神经网络之前,我们永远不会了解神经网络的所有知识),请考虑以下比较:
两者都将具有相同的数据量,对于卷积网络而言,不会有太大的不同。但是对于第一种情况,网络可能会更好地发现道路之间的连接,也许会发现更多的路段可能被某些东西覆盖,而充满边界的小补丁可能会更多地关注纹理,但效果不佳找出这些差距。
当然,所有这些都是猜测。测试是最好的。
我在GPU中的网不能真正使用大补丁,这对我来说是有害的...