识别不同物体的ABBYY Flexicapture布局/设置站

时间:2013-08-07 16:09:46

标签: ocr abbyy

当我在布局工作室中构建ABBYY flexicapture布局时,它可以完美地捕获所有内容。保存并将布局导出到Setup Station后,缺少某些信息,特别是重复组中的信息。

例如,在Layout studio中的重复组中,我可以找到页面上列出的所有两个“税”。所有都被认可的质量好,没有错误。但是,在设置站中,只会捕获2种税中的1种。

FL studio Location_Taxes重复块 FL studio Location_Taxes repeating block

FL Studio捕获税(2/2) FL Studio Captured Taxes (2/2)

关闭税务重复小组 CLose up of Tax Repeating Group

FC Studio捕获税(1/2) FC Studio Captured tax (1/2)

我是否遗漏了一些会导致识别在布局工作室中工作但在Setup / Capture中没有的东西?

由于

2 个答案:

答案 0 :(得分:1)

看看您的ABBYY FlexiLayout项目会有两个原因,我可以测试并确认解决方案。但我认为我看得很清楚。

使用可重复的组元素捕获元素时,请确保将块下的FlexiLayout Studio中的捕获结果公开到已启用“具有重复实例”的块中(复选标记)。这将显示FlexiCapture中的所有实例,而不仅仅是第一个捕获的实例。我认为这是你的问题,因为你声明在FC中只看到一个实例。

即使所有内容都设置正确,您在FlexiLayout中看到的内容与FlexiCapture中的结果不匹配的可能性也很小。但这种情况很少见,只发生在特别复杂的文件或某些特定设置上。这样的示例可能是在FL中看到5个实例并且在FC中只获得4个实例。

Ilya Evdokimov

答案 1 :(得分:1)

我们可能偶然发现了这个问题(即使它不应该是问题)。我正在使用正则表达式来查找税额的正确格式,如下图所示。

Regex for TaxAmount

这在布局工作室工作。但是,在FlexiCapture中没有找到税。删除正则表达式限制后,让它只是找到任何Flexicapture然后工作。你会认为这意味着捕获工作室找到的东西与正则表达式不匹配。但不,它发现' .22'就像它应该有的那样。

仍然想知道为什么会这样做。我想继续使用正则表达式,因为它有助于不识别错误的东西。有什么想法吗?