标签: ocr tesseract
我想知道如何从Tesseract的输出中提取线高和基线信息。
非常感谢任何指示。
谢谢, 瓦桑特
答案 0 :(得分:2)
试试这个:
Tesseract.getUtf8Text().getBoxRects()
这将为每个识别的符号返回一个边界框(Rects)数组。它们的坐标与您提供的位图有关。您可以使用它们来平均线高和基线。