有没有办法从tesseract中提取文档的样式信息?

时间:2014-09-11 05:46:51

标签: c++ machine-learning ocr tesseract

我想从tesseract中提取文本文档的样式信息。这些样式信息包括有关标题,副标题,粗体,斜体和下划线等文本样式的信息。tesseract代码的哪一部分为我提供了这些信息?

1 个答案:

答案 0 :(得分:0)

ResultIterator类具有生成字体信息的WordFontAttributes方法。