如何使用pytesseract同时提取信心和文本

时间:2019-12-09 13:17:47

标签: python tesseract python-tesseract

我目前正在使用两个不同的函数调用来使用pytesseract提取文本和置信度。我想知道如何仅通过一个调用直接提取文本和conf(请记住保留空格)。

我当前的代码:

import pytesseract
psm=6
text=pytesseract.image_to_string('image.jpg',config='--psm {} -c preserve_interword_spaces=1'.format(psm))

conf_object=list(pytesseract.image_to_data('image.jpg',output_type='data.frame', config='--psm {} -c preserve_interword_spaces=1'.format(psm))['conf'])
conf = list(filter(lambda x: x!= -1, conf_object))
if len(conf):
   conf = (sum(conf) / len(conf))/100
else:
   conf=0

0 个答案:

没有答案