import pytesseract
from PIL import Image, ImageEnhance, ImageFilter
pytesseract.pytesseract.tesseract_cmd="C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe"
im = Image.open("C:\\1.png") # the second one
im = im.filter(ImageFilter.MedianFilter())
enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(2)
im = im.convert('1')
im.save('temp2.png')
#im.show()
text = pytesseract.image_to_string(Image.open('temp2.png'),config='-psm 8')
print(text)
大家好
我正在尝试从image(captcha)提取文本,所以到目前为止,这是我上面编码的代码。 我认为到目前为止没有任何问题,因为运行时会出现任何错误。但是输出是如此糟糕。
当我运行此命令时,它什么也没显示,但是我将-psm 8更改为-psm 5,它显示了';«'。
您能给我一些建议来解决它吗?
答案 0 :(得分:0)
完成了。
我更改了其他图片进行测试,至少这张图片没有问题。
但是我认为这个模块太差了。最好找到其他模块。