pytesseract的输出是如此奇怪,没有任何错误

时间:2018-07-03 01:52:46

标签: python tesseract

enter image description here

import pytesseract

from PIL import Image, ImageEnhance, ImageFilter

pytesseract.pytesseract.tesseract_cmd="C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe"
im = Image.open("C:\\1.png") # the second one 
im = im.filter(ImageFilter.MedianFilter())
enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(2)
im = im.convert('1')
im.save('temp2.png')
#im.show()
text = pytesseract.image_to_string(Image.open('temp2.png'),config='-psm 8')
print(text)

大家好

我正在尝试从image(captcha)提取文本,所以到目前为止,这是我上面编码的代码。 我认为到目前为止没有任何问题,因为运行时会出现任何错误。但是输出是如此糟糕。

当我运行此命令时,它什么也没显示,但是我将-psm 8更改为-psm 5,它显示了';«'。

您能给我一些建议来解决它吗?

1 个答案:

答案 0 :(得分:0)

完成了。

我更改了其他图片进行测试,至少这张图片没有问题。

但是我认为这个模块太差了。最好找到其他模块。