我正在使用tesseract从图像中提取文本,图像是使用文本检测器获得的车牌图像
from PIL import Image
import pytesseract
import cv2
img= cv2.imread('text0.jpg')
print (pytesseract.image_to_string(th))
但是,它没有提供准确的文本,我可以使用任何过滤器来改善图像质量吗? 请查看并提供反馈。
答案 0 :(得分:0)
您应确保文本水平,并且我希望此修改会有所帮助
from PIL import Image
import pytesseract
import cv2
img= cv2.imread('text0.jpg',0)
h,w= img.shape
img= cv2.resize(img, (w*2,h*2))
retval2,th = cv2.threshold(img,35,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)
print (pytesseract.image_to_string(th))
您可以尝试其他方法,例如模糊和改变对比度。