Google Cloud Vision文本检测问题与文本语言管理

时间:2016-04-21 15:23:14

标签: google-cloud-vision

我在使用Google Cloud Vision的文本检测功能时遇到了以下问题:

1)我使用相同的Python代码将相同的图像提交到Google Cloud Vision,来自2台不同的计算机(基于Windows的开发计算机和基于Linux的“生产”计算机),但我得到2个不同的输出。相同的图像,相同的代码,相同的库,但提取的文本是不同的。

2)我为两个不同的检测文本得到两个不同的检测区域。我的原始文本是混合了数字的意大利文本。在开发机器上,检测到的区域设置为“zh”(中文)。在“生产”机器上,检测到的区域设置是“fil”。 https://cloud.google.com/translate/v2/using_rest#language-params中没有任何“fil”代码,所以我不知道它是什么(菲律宾?)。无论如何,当检测到的语言环境为“zh”时,我在开发机器上得到了更好的结果。所以...相同的图像,相同的代码,但不同的检测区域设置和不同的检测文本。

3)因此我尝试使用ImageContext languageHints注释https://cloud.google.com/vision/reference/rest/v1/images/annotate#AnnotateImageRequest来强制“it”或“zh”语言环境,现在有趣的是:如果我在开发机器上将languageHints设置为['it'] ,我几乎没有得到Google Cloud Vision的输出。如果我将它设置为['ja'](日语),Google Cloud Vision会说文本区域设置为“it”(!!),我得到了一些不错的结果(!!!)。但是,如果我在“生产”机器上设置['ja'],Google Cloud Vision会说文本区域设置为“oc”(?)。所以...相同的图像,相同的代码,但不同的检测区域设置和不同的检测文本。此外,检测到的语言环境和文本不遵循我使用languageHints设置的内容,但是当我更改languageHints参数时,检测到的语言环境(和文本)也会以不可预测的方式发生变化。

你有任何提示吗?感谢。

0 个答案:

没有答案