应用错误收集

时间：2019-07-15 00:21:25

标签： microsoft-cognitive azure-cognitive-services form-recognizer

我要在表单识别器中使用的表单具有多个复选框。当前，表单识别器的OCR引擎似乎无法检测到复选框。有没有解决的办法，还是有办法训练复选框识别？

我也尝试过在Windows和Linux上使用tesseract，但是我也无法在那里解决它。

复选框是您的标准空心正方形。有时它们上可能带有“ x”或复选标记。

如果没有解决方案，那么我可能会要求客户将复选框从复选框更改为实心圆圈（单选按钮）。我还没有测试过，看看OCR会对它们产生什么影响。

编辑：我阅读了表单识别器文档，并且看到它明确表示不支持复选框和单选按钮。我想知道是否有人可以解决吗？

答案 0 :(得分：1)

根据定义，OCR用于“字符识别”（请参见here）。复选框或单选按钮不是字符，因此OCR无法识别它。

您仍然可以尝试使用自定义视觉检测器来找到这些项目，但这会有些复杂，因为此服务只能在您的文档中找到这些项目，并且您必须与OCR调用结合才能获得文本，然后尝试匹配文档中的区域，以了解哪些文本与哪个组合/单选按钮相关联

答案 1 :(得分：1)

在Form Recognizer中，如果表单具有一致的布局，则可以使用新的GUI工具标记该区域，然后将该特定区域传递给OCR以尝试改善结果。

答案 2 :(得分：1)

@ Ram-msft建议的方法可以工作，但是我发现识别器很难始终如一地挑选出框中的任何单个字符-尽管说实话，复选框类型的框似乎比在框中输入数字要好（至少以我的经验）。

只要您对框中的任何“值”感兴趣（即它不为空），那么该方法应会为您提供合理的结果，直到他们提出真正的解决方案为止。

答案 3 :(得分：1)

对复选框的支持已添加到2.1版的Form Recognizer中（从2020年9月开始公开预览）。 From the announcement：

复选框/选择标记检测 –表单识别器支持检测和提取选择标记，例如复选框和单选按钮。选择标记已在布局中提取，您现在可以还可以在“火车自定义模型-带有标签的火车”中进行标签和训练提取选择标记的键值对。

Get Analyze Layout Result API响应中现在有一个selectionMarks对象，其中列出了检测到的选择标记及其状态（selected或unselected）。

从2.1版开始，sample labeling tool中也添加了对标签复选框和选择标记的支持。