我要在表单识别器中使用的表单具有多个复选框。当前,表单识别器的OCR引擎似乎无法检测到复选框。有没有解决的办法,还是有办法训练复选框识别?
我也尝试过在Windows和Linux上使用tesseract,但是我也无法在那里解决它。
复选框是您的标准空心正方形。有时它们上可能带有“ x”或复选标记。
如果没有解决方案,那么我可能会要求客户将复选框从复选框更改为实心圆圈(单选按钮)。我还没有测试过,看看OCR会对它们产生什么影响。
编辑:我阅读了表单识别器文档,并且看到它明确表示不支持复选框和单选按钮。我想知道是否有人可以解决吗?
答案 0 :(得分:1)
根据定义,OCR用于“字符识别”(请参见here)。复选框或单选按钮不是字符,因此OCR无法识别它。
您仍然可以尝试使用自定义视觉检测器来找到这些项目,但这会有些复杂,因为此服务只能在您的文档中找到这些项目,并且您必须与OCR调用结合才能获得文本,然后尝试匹配文档中的区域,以了解哪些文本与哪个组合/单选按钮相关联
答案 1 :(得分:1)
在Form Recognizer中,如果表单具有一致的布局,则可以使用新的GUI工具标记该区域,然后将该特定区域传递给OCR以尝试改善结果。
答案 2 :(得分:1)
@ Ram-msft建议的方法可以工作,但是我发现识别器很难始终如一地挑选出框中的任何单个字符-尽管说实话,复选框类型的框似乎比在框中输入数字要好(至少以我的经验)。
只要您对框中的任何“值”感兴趣(即它不为空),那么该方法应会为您提供合理的结果,直到他们提出真正的解决方案为止。
答案 3 :(得分:1)
对复选框的支持已添加到2.1版的Form Recognizer中(从2020年9月开始公开预览)。 From the announcement:
复选框/选择标记检测 –表单识别器支持 检测和提取选择标记,例如复选框和 单选按钮。选择标记已在布局中提取,您现在可以 还可以在“火车自定义模型-带有标签的火车”中进行标签和训练 提取选择标记的键值对。
Get Analyze Layout Result API响应中现在有一个selectionMarks
对象,其中列出了检测到的选择标记及其状态(selected
或unselected
)。
从2.1版开始,sample labeling tool中也添加了对标签复选框和选择标记的支持。