Question

我正在使用Google云视觉测试OCR，我发现结果特别糟糕。我的文件是法文的，但它缺少许多撇号和逗号。例如，输入

使用代码

Request
        .post(`https://vision.googleapis.com/v1/images:annotate?key=AIzaSyAtArxxxxxxxxxxxxxxxxxpGrKrydU4`)
        .send({
          requests: [{
            image: { content: base64.replace('data:image/jpeg;base64,', '') },
            features: [{ type: 'DOCUMENT_TEXT_DETECTION' }],
            "imageContext": { "languageHints": [ "fr" ] }
          }]
        })

我得到结果（错误以黄色突出显示）

当我使用Microsoft Azure OCR测试相同的图像时，结果绝对完美，无需指明语言。

Google Cloud Vision中有没有人遇到过类似的不准确之处？

Answer 1

您可以使用"languageHints": ["fr"]

进行指定

{
  "requests": [
    {
      "imageContext": {
        "languageHints": ["fr"]
      }
    }
  ]
}

哪些选项可以使用Google CLoud Vision改善OCR？

1 个答案: