寻求工作的验证码机器学习工具

时间:2018-03-17 10:30:55

标签: tensorflow machine-learning captcha

我正在寻找任何工作 python3验证码求解器。

我的重点在于一个相对简单的六位数验证码:

1 2

培训材料是2000解决验证码。

我尝试过来自dsaveliev的求解器 - 它专注于一个非常相似的验证码,"Chinese Patrick"Adam Geitgy。但是他们都犯了各种错误,似乎github用户“letarg0”在两周前和我一样做了同样的研究。

我不确定单位数分离。然而,Geitgy的extract_single_letters_from_captchas.py对我的例子效果不佳。

很可惜,但我自己也写不出来。你知道我的工具吗?

1 个答案:

答案 0 :(得分:0)

您可以使用openCV和tesseract OCR

import cv2.cv as cv
import tesseract
gray = cv.LoadImage('captcha.jpeg', cv.CV_LOAD_IMAGE_GRAYSCALE)
cv.Threshold(gray, gray, 231, 255, cv.CV_THRESH_BINARY)
api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyz")
api.SetPageSegMode(tesseract.PSM_SINGLE_WORD)
tesseract.SetCvImage(gray,api)
print(api.GetUTF8Text())

来源:https://gist.github.com/chroman/5679049