我想知道是否有一种方法可以将OCR的自定义行边界框输入到tesseract
。我找不到用于寻线的文档。
假设我有一个列表,其中每个元素都由边界框坐标的列表组成,那么执行此操作的有效方法是什么?
此处使用自定义文本行,因为输入在多个方向上都有倾斜。
答案 0 :(得分:0)
在文件中写左,上,宽,高和备注(例如第一行等),在文件中每文本行指定一行。该文件必须与映像文件具有相同的名称,但扩展名为uzn
(例如,将myImage.tif
命名为myImage.uzn
),并且必须与映像文件位于同一目录中。然后指定单列模式 -psm 4
。
可以在here中找到uzn文件格式规范。