Question

我正在使用tesseract从图像中提取文本，图像是使用文本检测器获得的车牌图像

from PIL import Image
import pytesseract
import cv2

img= cv2.imread('text0.jpg')
print (pytesseract.image_to_string(th))

但是，它没有提供准确的文本，我可以使用任何过滤器来改善图像质量吗？请查看并提供反馈。

Answer 1

您应确保文本水平，并且我希望此修改会有所帮助

from PIL import Image
import pytesseract
import cv2

img= cv2.imread('text0.jpg',0)
h,w= img.shape
img= cv2.resize(img, (w*2,h*2)) 
retval2,th = cv2.threshold(img,35,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)

print (pytesseract.image_to_string(th))

您可以尝试其他方法，例如模糊和改变对比度。

通过文本检测器的bbox提高ocr准确性

1 个答案: