我对带有手写文本的Azure Form Recognizer的OCR有疑问。
在Azure的“示例标签工具”中添加标签之前,在手写的PDF文件上运行OCR时,OCR通常会错误地检测文本。使用其他形式分析和提取技术,通常会提供一个选项来输入应该被检测为实质上“校正” OCR的文本。为了在样本标签工具(Docker映像)中训练Azure Form Recognizer,我看不到有一种方法可以覆盖OCR文本并输入正确的文本。
我是否可以自己输入OCR无法检测或检测不正确的文本?
例如,下图是Azure的“示例标签工具”中的OCR所获取的图像: OCR detection sample image。
是否可以纠正此结果并告诉Form Recognizer文本应为:“ Bridget Sims,MD”?
答案 0 :(得分:0)
当前,没有办法立即校正OCR结果并提高其准确性。典型的场景是从一小组训练文件中训练一个表单识别器模型,并使用它来处理更多文档。在训练期间,少量的OCR错误对于模型质量不是必需的,您可以忽略它们。产品团队正在开发具有更好手写识别精度的新版OCR。
谢谢 鑫 [Microsoft Azure表单识别器团队]