标签: image-processing ocr tesseract python-tesseract
我正在尝试使用Pytesseract模块在Tesseract中使用Python对Tesseract的ocr输出执行某些后处理操作,这需要字字体大小信息。我知道可以使用Tesseract来检索字体大小信息,因为Tesseract.js在ocr输出中提供了此类信息(例如Word字体大小,具有相应置信度值的所有单个字符选择),但是我不知道如何获取与Python中的tesseract绑定相同。 tesseract lib是否还有其他python绑定以获取此类信息?