应用错误收集

pytesseract - 更准确地从图像中读取文本

时间：2018-02-20 11:08:36

标签： opencv python-tesseract

我正在研究pytesseract。我想从驾驶执照中读取数据。目前我正在使用.jpg将opencv图像转换为二进制（灰度）格式，但我的结果并不准确。你是如何解决这个问题的？是否有任何标准尺寸的图像？

1 个答案:

答案 0 :(得分：0)

通过设置Tesseract必须查看的矩形来本地化您的检测。然后，您可以根据矩形限制在该位置存在哪种类型的数据示例：数字，字母等。您还可以为tesseract创建字典文件以提高准确性（这可用于通过列出常用名称来检测持卡人姓名一份文件）。如果背景中存在干扰，则设计一个过滤器将其移除。祝你好运！