OCR:从Image中提取文本

时间:2016-08-31 20:43:00

标签: python image-processing ocr pytesser

我正在研究从图像中提取文本的程序。为此,我尝试使用TessaractOcropus库,我能够将简单的纯文本(黑白简单字体)从图像转换为文本字符串。例如:

Example of image 1

但我无法从复杂的图像中提取文本。让我们举例说一下这张图片:

Example of image 2

有谁知道如何实现这一目标?是否有任何库可用于从复杂图像中提取文本(具有不可预测的不同背景?我更喜欢Python,但语言不是吧。

1 个答案:

答案 0 :(得分:3)

所有这些单词识别工作如何是机器学习算法,用已经解释过的相应文本输入了很多图像。它学会理解来自不同字体和外观的字母。

但是,徽标是使用非常特定的字体制作的。几乎没有两个徽标使用类似的徽标。这使得创建学习数据以识别所写内容非常困难(如果不是不可能的话)。

可以训练算法在它看到的任何地方识别Sprite商标。为此,您需要使用OpenCV并在不同质量的Sprite徽标上进行训练,商店,瓶子等上的Sprite徽标图片。这样,它就能看到这个特定的徽标(您还需要一个非精灵徽标的数据集,如可口可乐徽标或完全不相关的图片,如猫)。

与计算机不同,人类可以学习识别这些东西的原因是因为人类的大脑比你能创造的神经网络能够更好地理解计算机中的那种东西。当计算机在计算能力方面与人类一样强大时,请重新提出这个问题,你将从人类机器中获得自动回答。