tesseract-ocr使用字符编码从图像中读取文本

时间:2018-11-03 04:44:46

标签: python ocr tesseract

我需要使用 Tesseract OCR 读取文本,并且需要从图像中获取字符位置,有什么方法可以完成这些任务,请帮助我

1 个答案:

答案 0 :(得分:0)

我得到了答案,我在hocr上使用Tesseract

  

hOCR是用于从光学字符识别中获取格式文本的数据表示的开放标准。该定义使用可扩展标记语言以超文本标记语言或XHTML的形式对文本,样式,布局信息,识别置信度度量标准和其他信息进行编码

类似于

的命令行语法
tesseract someimage.jpg hocr