我正在这样运行Tesseract:
tesseract input.jpg outputbase --oem 1 -l eng -c hocr_char_boxes=1 hocr
我无法在任何地方找到问题的答案,
例如,当特定字符的置信度得分低于某个阈值时,如何以置信度输出推荐的其他推荐字符?
cf ABBYY FineReader输出(IsSuspicious标志和关联的输出)。
例如,如果Tesseract将检测到uni9ue
,但是9
处于“低”置信度(例如,嘈杂),我是否可以让引擎以某个置信度值返回“ q”(无使用字典)?
谢谢!