使用Tesseract和Pyocr在Python中获取字体大小

时间:2016-09-05 05:55:11

标签: python tesseract font-size python-tesseract

是否可以使用pyocrTesseract从图像中获取字体大小? 以下是我的代码。

tools = pyocr.get_available_tools()
tool = tools[0]
txt = tool.image_to_string(
      Imagee.open(io.BytesIO(req_image)),
      lang=lang,
      builder=pyocr.builders.TextBuilder()
)

我在这里使用函数image_to_string从图像中获取文本。而现在,我的问题是,如果我的文本也能得到font-size(数字)。

1 个答案:

答案 0 :(得分:0)

使用tesserocr,您可以在图片上调用ResultIterator后获得Recognize,您可以调用WordFontAttributes方法获取所需信息。阅读方法的文档以获取更多信息。

import io
import tesserocr
from PIL import Image

with tesserocr.PyTessBaseAPI() as api:
    image = Image.open(io.BytesIO(req_image))
    api.SetImage(image)
    api.Recognize()  # required to get result from the next line
    iterator = api.GetIterator()
    print iterator.WordFontAttributes()

示例输出:

{'bold': False,
 'font_id': 283,
 'font_name': u'Times_New_Roman',
 'italic': False,
 'monospace': False,
 'pointsize': 9,
 'serif': True,
 'smallcaps': False,
 'underlined': False}