改善tesseract的许多图像

时间:2018-08-20 18:21:58

标签: python tesseract python-tesseract

您对如何提高许多图像的tesseract速度有任何想法吗?我有两个例子。首先,我将图像转换为包含大约200个单词的文本。 1秒。其次,我有一个包含100个图像的循环,其中包含2个单词,并且需要 16秒。 如何缩短第二种情况的时间?

代码1:

import pytesseract
from PIL import Image
patch = './pdf_2_jpg/image.jpg'
multi = Image.open(patch)
result = pytesseract.image_to_string(multi)

代码2:

import pytesseract
from PIL import Image
patch = './pdf_2_jpg/image2.jpg'
single = Image.open(patch)
for x in range(100):
    result = pytesseract.image_to_string(single,lang='eng',config='--psm 6')

image image2

0 个答案:

没有答案