我是KofaxTotalAgility解决方案的新手,但是我非常了解OCR,OMR和识别机制。
我在一个文件夹中有两种形式,A和B。 它们都是相同的,但是由于手动扫描,所以轴有轻微变化,例如右移20像素,因此布局略有不同。
Image A和Image B的布局不同,表单在页面中的位置也不固定。 我知道,其他解决方案(例如“ Abbyy优秀阅读器”)也可以提供flexilayout,我们可以在其中通过查找文本并从右上方自上而下设置以自动识别区域来进行处理。
当我开始学习KofaxTotalAgility时,我不知道“ kofax Transformation Designer”提供的所有选项。
我的问题是我应该使用哪个定位器,我当前正在使用/正在使用超前区域定位器,并且对于我设置为参考的一个文档(图像A),提取是否合适。但是对于其他图像,由于布局不匹配的文本/框字段而无法提取(图像B)。
任何人都可以从我可以正确处理此案的地方指出正确的方向。 我知道,我要求直接选择/解决方案,任何帮助都是非常可贵的。
答案 0 :(得分:1)
通常,Kofax Transformations具有两组定位器:
这是前几天我创建的(非详尽的)图表:
使用表单时,您可能会倾向于依赖于表单特定的定位器,例如“高级区域定位器”。尽管此定位器可以解决“四处移动”的字段(例如,由于图像抖动,缩放或变形)的问题,但存在某些限制。其他定位器没有这些限制-例如,格式定位器允许您定义某个模式(正则表达式),该模式应与必须在该模式周围某个位置找到的关键字进行匹配。
以您的示例为例,您可以创建一个M|F|X
之类的正则表达式,然后将“性别”定义为需要在左侧出现的关键字。
但是,任何由确定性决定的定位器都遵循墨菲定律-有时关键字可能会更改。可能有不同的语言。也许可以添加某些性别的其他字母;最终破坏了您的提取逻辑。
输入AI-尽管在使用“组定位器”时Murphy的定律仍然适用,但区别在于用户可以训练系统以拾取新数据。所述定位器将自动找出提取数据的最佳方法。如果您使用了格式定位器,则客户需要联系您以添加其他表达式,或者更改关键字。
在您的特定情况下,我会先尝试使用可培训的小组定位器。如果您已经知道要查找的内容(例如,您在数据库中的某个位置的SSN),请使用数据库定位器。尽量不要使用 Format Locators (格式定位器)。 高级区域定位器在处理表单时很有用,但我发现自己几乎专门将它们用于手印或复选框识别。