深度学习模型可清理文档

时间:2018-11-05 08:03:50

标签: python deep-learning pytorch

我正在尝试构建卷积自动编码器,该卷积自动编码器可以从官方文档中删除笔标记,例如圆圈,下划线等。

我有原始的,干净的软质文档副本和带钢笔标记的施乐复印件。

施乐的副本显然不会与原始文档完全匹配,并且在扫描时会稍微歪斜或移位等。

另外,由于文档大小很大(2360,1650),因此我不得不将图像分成4个大小部分(587,412),以输入模型。

我想知道的是,上述问题在培训过程中是否会引起任何问题,并且有任何纠正方法?

任何帮助将不胜感激。

谢谢

编辑:

Original Image

Noisy Image

正如您所看到的(希望如此!),由于干燥时的偏斜或平移,嘈杂的图像略有不同。

1 个答案:

答案 0 :(得分:-1)

我认为这不会引起任何问题。但是,如果确实如此,您始终可以加载图像,将其调整为所需的形状,然后将其输入到模型中。