解决仅数字验证码

时间:2015-09-17 12:51:16

标签: command-line ocr captcha tesseract digits

有一个我正试图解决的验证码,我知道它总是数字。 当我尝试命令tesseract cap.png cap时,它返回空页!!!

当我尝试命令tesseract cap.png cap -psm 6 digits && cat cap.txt时,它返回:

[root@usa1 ~]# tesseract cap.png cap -psm 7 digits && cat cap.txt
Tesseract Open Source OCR Engine v3.05.00dev with Leptonica
Info in pixReadStreamPng: converting (cmap + alpha) ==> RGBA
Info in pixReadStreamPng: converting 8 bpp cmap with alpha ==> RGBA
41-1-8 5

还有:

[root@usa1 ~]# tesseract cap.png cap -psm 7 digits && cat cap.txt
Tesseract Open Source OCR Engine v3.05.00dev with Leptonica
Info in pixReadStreamPng: converting (cmap + alpha) ==> RGBA
Info in pixReadStreamPng: converting 8 bpp cmap with alpha ==> RGBA
7 5 

验证码样本是:

Captcha example

主要目标是获得准确的结果,而且我注意到两次运行相同的命令不会对结果产生任何影响,所以我不能运行它3例并比较不同的结果吧? 至于空页面错误,我猜不知道我需要让png文件的质量更高,我错了吗?

0 个答案:

没有答案