pytesseract - 更准确地从图像中读取文本

时间:2018-02-20 11:08:36

标签: opencv python-tesseract

我正在研究pytesseract。我想从驾驶执照中读取数据。目前我正在使用.jpgopencv图像转换为二进制(灰度)格式,但我的结果并不准确。你是如何解决这个问题的?是否有任何标准尺寸的图像?

1 个答案:

答案 0 :(得分:0)

通过设置Tesseract必须查看的矩形来本地化您的检测。然后,您可以根据矩形限制在该位置存在哪种类型的数据示例:数字,字母等。您还可以为tesseract创建字典文件以提高准确性(这可用于通过列出常用名称来检测持卡人姓名一份文件)。如果背景中存在干扰,则设计一个过滤器将其移除。祝你好运!