应用错误收集

您对如何提高许多图像的tesseract速度有任何想法吗？我有两个例子。首先，我将图像转换为包含大约200个单词的文本。 1秒。其次，我有一个包含100个图像的循环，其中包含2个单词，并且需要 16秒。如何缩短第二种情况的时间？

代码1：

import pytesseract
from PIL import Image
patch = './pdf_2_jpg/image.jpg'
multi = Image.open(patch)
result = pytesseract.image_to_string(multi)

代码2：

import pytesseract
from PIL import Image
patch = './pdf_2_jpg/image2.jpg'
single = Image.open(patch)
for x in range(100):
    result = pytesseract.image_to_string(single,lang='eng',config='--psm 6')

image image2

改善tesseract的许多图像

0 个答案: