目前我正在使用tessaract来检测图像上的文字,这些文字能够解决其中的一半,但是我会卡在像this这样的图像上。请帮忙。
try:
import Image
except ImportError:
from PIL import Image
import pytesseract,sys
import re
import cv2
path='C:\\Users\\Raj\\taskocr\\imgs\\'
pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files\\Tesseract-OCR\\tesseract'
def ocrcheck(filepath):
#print (pytesseract.image_to_string(Image.open(filepath),config=' -load_system_dawg 0')).encode(sys.stdout.encoding, errors='replace')
return re.search('[a-zA-Z]+',(pytesseract.image_to_string(Image.open(filepath),config=' ')).encode(sys.stdout.encoding, errors='replace'))
print ocrcheck(path+'None10E8261A12.jpg')