我目前正致力于车牌识别。出于同样的目的,我使用提取和预处理的字母数字字符图像训练了tesseract。
在0,Q,D和B,8的字母中,出现了歧义。我附上了0,Q,D的图像。请帮我做什么。我已经使用过unicharambigs但没有用。是因为我对Q有较少的训练图像吗?
答案 0 :(得分:0)
在将图像发送到Tesseract之前,您可以进行一些图像处理。您可以查看以下链接:
image processing to improve tesseract OCR accuracy
您还可以查看Tesseract-Ocr GitHub及其改进质量文档:
https://github.com/tesseract-ocr/tesseract/wiki/ImproveQuality
较少的训练可能是一个原因,但你也可以对图像处理产生很大的影响。
此外,您还可以查看其他车牌识别问题: