目标是制作一个可识别鸡蛋标记的应用程序,例如0-DE-134461
。我在以下图片中尝试了Tesseract和Google Vision API。两个OCR引擎的结果都是灾难性的。
0-DE-46042
Tesseract → ""
Google Vision API → " 2 "
3- ES08234-25591
Tesseract → ""
Google Vision API → " Es1234-2SS ) R SHAH That is part "
我用Photoshop手动裁剪图像。
0-DE-46042
Tesseract → ""
Google Vision API → ""
3- ES08234-25591
Tesseract → "3ΓÇöE503ΓÇÿ234-gg"
Google Vision API → " -ESOT23-2559 ) "
我用Photoshop手动对两个蛋上的文字进行了颜色选择并删除了背景。
0-DE-46042
Tesseract → "OΓÇöDEΓÇö46042"
Google Vision API → " O-DE-46042 "
3- ES08234-25591
Tesseract → ""
Google Vision API → " 3-ESO8234-9 "
我认为最后一个预处理步骤应该是删除循环变形,但我不知道如何使用Photoshop手动完成,更不用说自动化了。
我用来获取tesseract OCR结果的命令:
λ tesseract {egg_picture}.jpg --psm 7 stdout
tesseract版本:
λ tesseract --version
tesseract 4.0.0-alpha.20170804
leptonica-1.74.4
libgif 4.1.6(?) : libjpeg 8d (libjpeg-turbo 1.5.0) : libpng 1.6.20 : libtiff 4.0.6 : zlib 1.2.8 : libwebp 0.4.3 : libopenjp2 2.1.
平台:Windows 10
我使用OpenCV在一些鸡蛋标记图像上应用了自适应阈值处理。这些是迄今为止的结果:
然而,仍有很多噪音。我努力调整参数,以便在不同的图像中很好地工作。