应用错误收集

培训计算机视觉OCR

时间：2020-05-29 00:47:28

标签： computer-vision ocr azure-cognitive-services

我设置了Azure计算机视觉服务并在我的应用中使用。当我尝试在某些图像上执行OCR时，它无法识别所有文本（即，在“杯子”中遗漏了“ S”）。如果无法正确识别文本，可以在OCR中对其进行培训吗？

2 个答案:

答案 0 :(得分：0)

OCR工具无法检测到所有情况并非总是如此。您可以在将某些图像发送到天蓝色之前尝试对其进行预处理。 Preprocessig

答案 1 :(得分：0)

根据您提供的图像和信息，我快速检查了Computer Vision API的输出，该输出具有多种用于文本处理的操作：

OCR：原始版本，同步
识别文本：异步的第二个，最后一个不推荐使用
批量读取（2.0＆2.1）>读取（3.0）：最新版本，也是异步的。

就结果质量而言，“读取”操作更好，特别是对于旋转的项目和其他情况。

以下是通过认知工作台https://moderatorsampleimages.blob.core.windows.net/samples/sample2.jpg（认知服务的开源演示）生成的图像（website）的输出示例。

OCR

您会看到一些错误：

在“ CAPABLE”之后有一个“ *”
“ OURSELVE”缺少“ S”
最后一个时期是逗号

识别文字

这里唯一的问题是末期缺少时间段

批量读取

这里唯一的问题是末期缺少时间段

结论：使用现在可以普遍使用的Read 3.0。 API链接：https://westeurope.dev.cognitive.microsoft.com/docs/services/computer-vision-v3-ga/operations/5d986960601faab4bf452005