是否可以使用pyocr
或Tesseract
从图像中获取字体大小?
以下是我的代码。
tools = pyocr.get_available_tools()
tool = tools[0]
txt = tool.image_to_string(
Imagee.open(io.BytesIO(req_image)),
lang=lang,
builder=pyocr.builders.TextBuilder()
)
我在这里使用函数image_to_string
从图像中获取文本。而现在,我的问题是,如果我的文本也能得到font-size
(数字)。
答案 0 :(得分:0)
使用tesserocr,您可以在图片上调用ResultIterator
后获得Recognize
,您可以调用WordFontAttributes
方法获取所需信息。阅读方法的文档以获取更多信息。
import io
import tesserocr
from PIL import Image
with tesserocr.PyTessBaseAPI() as api:
image = Image.open(io.BytesIO(req_image))
api.SetImage(image)
api.Recognize() # required to get result from the next line
iterator = api.GetIterator()
print iterator.WordFontAttributes()
示例输出:
{'bold': False,
'font_id': 283,
'font_name': u'Times_New_Roman',
'italic': False,
'monospace': False,
'pointsize': 9,
'serif': True,
'smallcaps': False,
'underlined': False}