使用卷积时,通常会识别大象或狗等图像中的大物体。然后,第一个卷积层识别边缘,最后一层聚焦于更抽象的特征,如腿或身体形状。
我目前正在处理的任务有所不同:我的图像尺寸为512x512,黑白扫描文档。我不需要识别文本或其他复杂的模式,而是需要找到像墨迹一样的东西。网络应该只知道是否有类似的东西。
通常,我正在使用这样构建我的网络:
model = Sequential()
model.add(InputLayer((512, 512, 1))
for size in [32, 64, 128, 256, 512, 512, 512]:
model.add(Dropout(0.1))
model.add(Conv2D(size, (3,3), 'relu'))
model.add(Conv2D(size, (3,3), 'relu'))
model.add(AveragePooling2D())
model.add(Flatten())
model.add(Dense(256, 'relu'))
model.add(Dense(1, 'sigmoid'))
这是我在这个用例中经常使用和尝试的结构,但我的结果并不是压倒性的,这就是为什么我在质疑我的结构。如果我只需要识别尺寸为5x5或30x30的图案的存在,我应该使用不同的结构吗?