为什么pytesseract在分段字符上的速度较慢?

时间:2017-07-22 06:46:06

标签: python python-3.x ocr tesseract python-tesseract

我的照片是' 105'

我的预处理将其变为黑白,并使其变大(300dpi)并清除它。

当我用整个图像/单词运行时:

pytesseract.image_to_string(img, None, False, "-psm 8 digits")

它读取整个图像,结果准确,(8个选项用于单个单词)。

为什么我要对字符进行细分,然后将它们逐个发送给' 1' ,' 0' ,' 5' ,处理结果需要3倍的时间(我没有计算预处理工作(分段)中的增加时间。

我对每个分段字符使用它:

pytesseract.image_to_string(img_orig, None, False, "-psm 10 digits")

(10个选项适用于单个字符,但我尝试了几乎所有选项并获得相同的时间结果)

字符与整个单词的大小相同,使用线程函数运行它,我得到了相同的结果。

'帮助' tesseract与字符的分割,应该比发送整个单词更快,这是一个更大的图像,因为字符之间有这么多无用的空间,没有?

0 个答案:

没有答案