CLOUD VISION API(OCR)很难识别七个段号

时间:2018-02-25 16:03:16

标签: google-vision

我想要识别的最简单的例子:

The simplest example of what I'm trying to recognize

我使用DOCUMENT_TEXT_DETECTION,但在答案中我得到了象形文字。

如果我在Eng方法的ImageContext参数中使用addAllLanguageHints,那么我的结果就是111。更好,但还是不好。

有没有办法表明数字被识别或以某种方式改善结果?

另外,如何使用setRepeatedField中的ImageContext选项?我找不到任何使用它的例子。

提前致谢。

2 个答案:

答案 0 :(得分:2)

像云视觉这样的经典OCR引擎未经过培训,无法识别7段显示器。如本项目所示,您将获得OpenCV的更多运气:https://www.pyimagesearch.com/2017/02/13/recognizing-digits-with-opencv-and-python/

答案 1 :(得分:2)

即使开箱即用也无法使用...您需要的是在默认标签不足时使用自定义标签对图像进行分类。 Cloud Auto ML Vision(从该蓝色下拉菜单中选择“视觉”)让您训练自定义模型,该模型可用于识别该字体。而且由于该7段显示器可能的形状数量非常有限,因此训练它应该不会太困难。如果您要获得一个显示效果更好的计算器,它也可能会更好地工作。上面的LCD看起来有点便宜,有那么大的空间和截止的结尾-但是,仍然可以训练它读取它。