Tesseract读错字符

时间:2019-06-23 10:09:32

标签: python tesseract

我正在使用tesseract从图像中提取文本。每当我置信度低时,我都会再次为该词运行tesseract。

但是在某些情况下,字符之间会被打断。我尝试了不同的组合,但没有得到任何结果。 像this图片

img=img.resize([img.width*2,img.height*2])
img=ImageEnhance.Brightness(img).enhance(3.0)    
pytesseract.image_to_data(img,output_type=Output.DICT,config='--psm 10')

此外,许多单词之间有黑点。有没有可以改善黑点的库,或者我只需要使用opencv。

0 个答案:

没有答案