标签: c++ machine-learning ocr tesseract
我想从tesseract中提取文本文档的样式信息。这些样式信息包括有关标题,副标题,粗体,斜体和下划线等文本样式的信息。tesseract代码的哪一部分为我提供了这些信息?
答案 0 :(得分:0)
ResultIterator类具有生成字体信息的WordFontAttributes方法。
ResultIterator
WordFontAttributes