从Tesseract输出中查找线高和基线

时间:2012-10-11 06:37:05

标签: ocr tesseract

我想知道如何从Tesseract的输出中提取线高和基线信息。

非常感谢任何指示。

谢谢, 瓦桑特

1 个答案:

答案 0 :(得分:2)

试试这个:

Tesseract.getUtf8Text().getBoxRects()

这将为每个识别的符号返回一个边界框(Rects)数组。它们的坐标与您提供的位图有关。您可以使用它们来平均线高和基线。