我正在使用tesseract在Python中执行OCR。 我想让TSV文件在置信度水平上进行一些分析,还要对文本文件进行读取。 但是,获取两个输出的唯一方法是运行tesseract两次,这很耗时:
tesseract input_image out_text -l eng
tesseract input_image out_tsv -l eng tsv
有没有一种方法可以一次执行创建两个输出?
答案 0 :(得分:2)
是的。试试:
tesseract input_image out tsv txt
不必指定-l eng
,因为它是默认语言。