您对如何提高许多图像的tesseract速度有任何想法吗?我有两个例子。首先,我将图像转换为包含大约200个单词的文本。 1秒。其次,我有一个包含100个图像的循环,其中包含2个单词,并且需要 16秒。 如何缩短第二种情况的时间?
代码1:
import pytesseract
from PIL import Image
patch = './pdf_2_jpg/image.jpg'
multi = Image.open(patch)
result = pytesseract.image_to_string(multi)
代码2:
import pytesseract
from PIL import Image
patch = './pdf_2_jpg/image2.jpg'
single = Image.open(patch)
for x in range(100):
result = pytesseract.image_to_string(single,lang='eng',config='--psm 6')