在ocring multi tiff文件时如何在tesseract中获取页面no

时间:2016-05-02 10:59:57

标签: image-processing ocr tesseract

如何在弹出多个tiff文件时在命令行中获取页面no。例如 -

>>> ================================ RESTART ================================
>>> 
1;9;3;7;2;4
>>> 

这里输出文件应该有来自tiff文件的相应页面no。

1 个答案:

答案 0 :(得分:0)

特定输出选项会产生页码。但是,在给定适当的开关的情况下,文本可以输出分页符:

tesseract -c include_page_breaks=1 -c page_separator="[PAGE SEPRATOR]" 109359.tiff 109359

请参阅此post