Python上的CAPTCHA识别算法

时间:2017-02-06 10:35:42

标签: python-2.7 opencv tesseract opencv3.0 pytesser

我尝试使用Python,OpenCV和Tesseract设计CAPTCHA识别算法。问题是CAPTCHA数字未对齐并随机聚集在图像中。 Pytesseract失败并且大部分时间都返回空列表。数据看起来像: this should return 41332 this should return 35545

更好地检测到数字在一行中的相对平坦的CAPTCHA。 我该如何解决这个问题? 如何检测,裁剪和重新排列图像中的数字,以便更容易使用tesseract(如果需要)来检测它们?

0 个答案:

没有答案