一次获得多个Tesseract PSM和文件格式

时间:2017-05-05 11:12:21

标签: php tesseract

是否可以立即从Tesseract获取多种PSM模式,以及纯文本和HOCR格式?

我目前在每个文档上运行Tesseract 3次:一次获取方向信息(PSM 0),一次获取格式化文本(PSM 3),一次获得HOCR格式化结果。这需要3倍的时间。

有没有更好的方法从Tesseract获取此信息而不会多次OCR文档?

我正在使用此PHP Tesseract wrapper.

$tess = new Tesseract();
$textor = $tess->recognize(storage_path("image.jpg"), null, 0);
$textplain = $tess->recognize(storage_path("image.jpg"), null, 3);
....

0 个答案:

没有答案