标签: python ocr tesseract
我需要使用 Tesseract OCR 读取文本,并且需要从图像中获取字符位置,有什么方法可以完成这些任务,请帮助我
答案 0 :(得分:0)
我得到了答案,我在hocr上使用Tesseract
hOCR是用于从光学字符识别中获取格式文本的数据表示的开放标准。该定义使用可扩展标记语言以超文本标记语言或XHTML的形式对文本,样式,布局信息,识别置信度度量标准和其他信息进行编码
类似于
tesseract someimage.jpg hocr