使用tesseract将Simple Captcha转换为字符串时出错

时间:2017-07-08 04:39:59

标签: python selenium captcha webautomation

我想自动化一个票务系统的登录过程。登录屏幕上有一个简单的验证码。我可以对它进行部分快照,但只要将该图像发送到image_to_string()函数,就会出现错误。错误说:

  

" [Win Error 2]系统找不到指定的文件"

The Code

The Error

1 个答案:

答案 0 :(得分:2)

这里的问题不在于tesseract无法找到您的图像,而是Windows无法找到tesseract。

pytesseract内部运行subprocess.Popen(['tesseract', input_file]),这会引发错误。但是,如果您尝试subprocess.Popen(['tesseract']),则会得到完全相同的错误。

如果您阅读了installation instructions,您会看到:

  

您必须能够以 tesseract 的形式调用tesseract命令。

  

如果不是这种情况,例如因为tesseract不在你的PATH中,你将不得不更改tesseract.py顶部的“tesseract_cmd”变量

因此,您可以将tesseract添加到PATH或修改tesseract_cmd以直接指向您的tesseract可执行文件。