是否可以立即从Tesseract获取多种PSM模式,以及纯文本和HOCR格式?
我目前在每个文档上运行Tesseract 3次:一次获取方向信息(PSM 0),一次获取格式化文本(PSM 3),一次获得HOCR格式化结果。这需要3倍的时间。
有没有更好的方法从Tesseract获取此信息而不会多次OCR文档?
我正在使用此PHP Tesseract wrapper.
$tess = new Tesseract();
$textor = $tess->recognize(storage_path("image.jpg"), null, 0);
$textplain = $tess->recognize(storage_path("image.jpg"), null, 3);
....