pytesseract无法获取全文

时间:2018-12-20 07:10:42

标签: python-tesseract

我正在尝试从图像grayScaleImage_withfiltering中提取文本

在我的情况下,tessract或pytessract代码能够在白色背景上获取黑色字体,但无法选择在黑色背景上具有白色字体的字体。 该图像是使用各种PIL滤镜从正常RGB图像创建的:

img = Image.open(imageFile)
width, height = img.size
new_size = width*8, height*8
img = img.resize(new_size, Image.LANCZOS)
img = img.convert('L')
img = img.point(lambda x: 0 if x < 200 else 250, '1')
imagetext = pytesseract.image_to_string(img)

如何从与字体颜色和背景颜色无关的图像中选择所有文本?我需要迎合许多此类图像,因此必须加以概括。 谢谢并恭祝安康 苏什米塔

0 个答案:

没有答案