我想知道训练集是否应该具有与测试集相同的分辨率。我想制作一个用于对象识别的CNN。我的数据集比我在网络上找到的数据清晰得多。问题是我在数据集中只发现了30个可以标记的对象。来自网络的数据已标记了200多张图片,但分辨率较差。这是我的数据和来自Web的数据的示例:https://imgur.com/a/pxSFU1x。
答案 0 :(得分:0)
我的两分钱:如果您拥有相同分辨率的图像,那肯定会有所帮助。
加载图像时,您将获得一个矩阵,其中每个像素都有一堆数字。您的神经网络将尝试识别标签图像共有的模式,然后在测试中寻找这些模式。
由于图像的不同,测试数据集中的模式将不会真正相同,这肯定会对结果产生负面影响。
一个愚蠢的例子是,如果您尝试识别屋顶上的天线而不是太阳能电池板。在您的图像中,天线具有某种形状,而在网络图像中,它们只是一个像素。这将使测试数据集完全无用。
但是,两个图像中的太阳能电池板具有非常清晰的特征(形状,颜色,对比度,轮廓),并且我相信您仍然应该尝试一下,因为在这种情况下,不同的分辨率可能不会造成很大的问题。