使用OCR引擎查找图像文字的哪一部分

时间:2019-03-14 14:04:12

标签: image-processing ocr tesseract text-extraction python-tesseract

我目前正在从事与OCR相关的项目。我成功地使用tesseract设计了OCR引擎。现在,我可以根据需要确定图像文件中存在文本的区域,以便我们可以同时显示图像和提取的文本,这将进一步增加减少错误的机会,因为用户可以查看并更正OCR引擎的输出。许多OCR服务提供商都做了同样的事情,这将提高提取的数据流形的可靠性。

1 个答案:

答案 0 :(得分:0)

Tesseract可以输出hOCR文件。它包含叠加数据。