哪些选项可以使用Google CLoud Vision改善OCR?

时间:2017-10-01 20:50:10

标签: javascript azure ocr google-cloud-vision

我正在使用Google云视觉测试OCR,我发现结果特别糟糕。 我的文件是法文的,但它缺少许多撇号和逗号。 例如,输入enter image description here

使用代码

Request
        .post(`https://vision.googleapis.com/v1/images:annotate?key=AIzaSyAtArxxxxxxxxxxxxxxxxxpGrKrydU4`)
        .send({
          requests: [{
            image: { content: base64.replace('data:image/jpeg;base64,', '') },
            features: [{ type: 'DOCUMENT_TEXT_DETECTION' }],
            "imageContext": { "languageHints": [ "fr" ] }
          }]
        })

我得到结果(错误以黄色突出显示) enter image description here

当我使用Microsoft Azure OCR测试相同的图像时,结果绝对完美,无需指明语言。

Google Cloud Vision中有没有人遇到过类似的不准确之处?

1 个答案:

答案 0 :(得分:0)

您可以使用"languageHints": ["fr"]

进行指定
{
  "requests": [
    {
      "imageContext": {
        "languageHints": ["fr"]
      }
    }
  ]
}