使用Tesseract 4从图像中检测单词的准确性差

时间:2019-03-15 05:50:25

标签: tesseract

我目前正在一个项目中,需要从图像中提取日期,时间,经度和纬度(如图所示)。 通过使用tesseract 4,我可以获取日期和时间,但有一点错误,即数字“ 0”被识别为“ 6”(关于此,我是否需要使用自己的数据微调tesseract 4?)。 但是,对于位于图像底部的经度和纬度,识别结果非常差,它甚至不会返回数字(仅返回符号和一些随机字母)。 我一直在寻找方法,以便在传递给tesseract之前,通过对opencv应用二进制,otsu阈值和高斯模糊来提高准确性。但是,结果似乎是最糟糕的,因为字母的底部趋于与白色背景合并(可能是由于经度和纬度字母的白色)。

我有什么办法可以得到准确的结果?我是这个领域的新手,希望有人可以为此提供一些解决方案或建议。

预先感谢一百万。 Image

0 个答案:

没有答案