应用错误收集

样本标签工具OCR文本检测问题

时间：2020-07-14 22:46:39

标签： ocr microsoft-cognitive form-recognizer

我对带有手写文本的Azure Form Recognizer的OCR有疑问。

在Azure的“示例标签工具”中添加标签之前，在手写的PDF文件上运行OCR时，OCR通常会错误地检测文本。使用其他形式分析和提取技术，通常会提供一个选项来输入应该被检测为实质上“校正” OCR的文本。为了在样本标签工具（Docker映像）中训练Azure Form Recognizer，我看不到有一种方法可以覆盖OCR文本并输入正确的文本。

我是否可以自己输入OCR无法检测或检测不正确的文本？

例如，下图是Azure的“示例标签工具”中的OCR所获取的图像： OCR detection sample image。

是否可以纠正此结果并告诉Form Recognizer文本应为：“ Bridget Sims，MD”？

1 个答案:

答案 0 :(得分：0)

当前，没有办法立即校正OCR结果并提高其准确性。典型的场景是从一小组训练文件中训练一个表单识别器模型，并使用它来处理更多文档。在训练期间，少量的OCR错误对于模型质量不是必需的，您可以忽略它们。产品团队正在开发具有更好手写识别精度的新版OCR。

谢谢鑫 [Microsoft Azure表单识别器团队]