Google Vision API文本提取数据的准确性(DOCUMENT_TEXT_DETECTION)

时间:2018-09-17 10:31:21

标签: google-cloud-platform ocr vision-api

使用JAVA SDK for GCP Vision API进行OCR(文本提取)。已从功能 TEXT_DETECTION 移至 DOCUMENT_TEXT_DETECTION 。我测试过的图像名称为“ Mohan D”。

  
      
  • TEXT_DETECTION :我得到的是正确的文本,但没有得到另一个字符
  •   
  • 如果我使用的是 DOCUMENT_TEXT_DETECTION ,则将其命名为“ MOHAND(空格不来了)
  •   

请问我是否需要使用任何特定选项来获得更高的数据准确性

1 个答案:

答案 0 :(得分:0)

Cloud Vision API 服务使用的模型总是在不断改进,以提供更好的识别准确性;但是,有时他们弄错了字符,甚至他们自己也不认识字符。请记住,这些服务每天都会接受培训,这意味着识别质量将相应提高。

基于此,我认为可用的解决方法是遵循files format/sizelanguage建议,并实现服务遇到困难时通常使用的LanguageHints属性检测图像中包含的语言,这可能有助于您提高OCR结果的准确性。