我有一个项目,我需要从传入的用户填充图像中减去空模板图像。文档类型是普通银行支票。
目的是通过从空模板图像中减去一个图像来从中提取手写字段。
我面临的问题是对齐这两个图像,因为有缩放,平移,旋转等
有关如何将模板图像与传入图像对齐的任何想法?
更新1:
我发布的是wikipedia页面的示例图片,但是以单色格式发布,因为我的图片是单色格式。
答案 0 :(得分:3)
在处理工业项目的图像处理时,我们在大多数情况下都有一个基准点。基准就像一个标记 - 可以是一个洞,一个十字标记 - 永不改变,总是处于相同的位置。
通常,两个基准点足以纠正旋转,平移和缩放等不对称问题。例如,如果你知道两者之间的距离,你可以随时检查它以确保比例因子是正确的,或者根据当前距离与正确距离的差异来校正它。
在您的情况下,我要问的是:模板和传入图像是否共享任何不变的视觉符号并且可以轻松分割?
如果你有这个问题的答案,其余的都会更简单 - 差异本身就是一个非常简单的算法。
答案 1 :(得分:1)
基本答案是编写一个带有两个图像和一个2D变换的函数,并告诉您将变换应用到目标图像后它们的对齐方式。该函数需要基于变换是连续的,并且具有局部最小值(0),其中图像完美对齐。这称为成本函数。
然后在函数和输入上使用任何优化算法 - 您正在尝试优化变换(平移,缩放,旋转)。例如爬山,遗传,模拟退火等。
有些产品可以做到这一点 - 通常它们被称为表单识别,表单注册,表单处理等。有些是SDK,但也有一些应用程序无需编程即可完成。
免责声明:我在Atalasoft工作,在那里我们向我们的.NET成像SDK销售Forms Processing add-on。