tesseract:字符含糊不清

时间:2016-03-16 05:15:01

标签: tesseract ambiguity

我目前正致力于车牌识别。出于同样的目的,我使用提取和预处理的字母数字字符图像训练了tesseract。

在0,Q,D和B,8的字母中,出现了歧义。我附上了0,Q,D的图像。请帮我做什么。我已经使用过unicharambigs但没有用。是因为我对Q有较少的训练图像吗?

1 个答案:

答案 0 :(得分:0)

在将图像发送到Tesseract之前,您可以进行一些图像处理。您可以查看以下链接:

image processing to improve tesseract OCR accuracy

您还可以查看Tesseract-Ocr GitHub及其改进质量文档:

https://github.com/tesseract-ocr/tesseract/wiki/ImproveQuality

较少的训练可能是一个原因,但你也可以对图像处理产生很大的影响。

此外,您还可以查看其他车牌识别问题:

Using tesseract to recognize license plates