如何为OCR输入定制行到tesseract?

时间:2019-07-28 16:27:40

标签: python ocr tesseract

我想知道是否有一种方法可以将OCR的自定义行边界框输入到tesseract。我找不到用于寻线的文档。

假设我有一个列表,其中每个元素都由边界框坐标的列表组成,那么执行此操作的有效方法是什么?

此处使用自定义文本行,因为输入在多个方向上都有倾斜。

1 个答案:

答案 0 :(得分:0)

在文件中写左,上,宽,高和备注(例如第一行等),在文件中每文本行指定一行。该文件必须与映像文件具有相同的名称,但扩展名为uzn(例如,将myImage.tif命名为myImage.uzn),并且必须与映像文件位于同一目录中。然后指定单列模式 -psm 4

可以在here中找到uzn文件格式规范。