224x224由于某种原因或仅仅是计算约束而提供更好的准确性吗?我认为更大的图片应该提供更好的准确性,不是吗?
答案 0 :(得分:3)
更大的图像包含更多可能相关或不相关的信息。输入的大小很重要,因为输入越大,网络必须处理的参数越多。更多参数可能会导致一些问题,首先您需要更多的计算能力。然后你可能需要更多的数据来训练,因为很多参数和没有足够的样本可能导致不合适,特别是CNN。 从AlexNet中选择224也允许他们应用一些数据扩充。
例如,如果你有一个512x512的图像而你想识别一个物体那么最好将它重新采样到256x256并获得224x224或200x200的较小补丁,做一些数据增加然后训练。如果您有足够的数据,您还可以使用400x400的补丁并进行数据增强和训练。
不要忘记进行交叉验证,以便检查是否有过度拟合。