培训计算机视觉OCR

时间:2020-05-29 00:47:28

标签: computer-vision ocr azure-cognitive-services

我设置了Azure计算机视觉服务并在我的应用中使用。当我尝试在某些图像上执行OCR时,它无法识别所有文本(即,在“杯子”中遗漏了“ S”)。 如果无法正确识别文本,可以在OCR中对其进行培训吗?

2 个答案:

答案 0 :(得分:0)

OCR工具无法检测到所有情况并非总是如此。您可以在将某些图像发送到天蓝色之前尝试对其进行预处理。 Preprocessig

答案 1 :(得分:0)

根据您提供的图像和信息,我快速检查了Computer Vision API的输出,该输出具有多种用于文本处理的操作:

  • OCR:原始版本,同步
  • 识别文本:异步的第二个,最后一个不推荐使用
  • 批量读取(2.0&2.1)>读取(3.0):最新版本,也是异步的。

就结果质量而言,“读取”操作更好,特别是对于旋转的项目和其他情况。

以下是通过认知工作台https://moderatorsampleimages.blob.core.windows.net/samples/sample2.jpg(认知服务的开源演示)生成的图像(website)的输出示例。

OCR

Ocr

您会看到一些错误:

  • 在“ CAPABLE”之后有一个“ *”
  • “ OURSELVE”缺少“ S”
  • 最后一个时期是逗号

识别文字

RecognizeText

这里唯一的问题是末期缺少时间段

批量读取

BatchRead

这里唯一的问题是末期缺少时间段

结论:使用现在可以普遍使用的Read 3.0。 API链接:https://westeurope.dev.cognitive.microsoft.com/docs/services/computer-vision-v3-ga/operations/5d986960601faab4bf452005