从网站检索验证码

时间:2019-04-01 20:31:07

标签: web-scraping

我需要从网站上获取人机验证码的图片,但是在所有其他教程中,人机验证码的源链接似乎不正常

我尝试了所有方法,但是我认为从代码方面来说没有什么问题,但是从网站的验证码方面来说没有问题,因为当我保存图像源lin的jpg图像时,我得到的图片没有打开。

#### Code:
r = session.get(url1)
response = BeautifulSoup(r.content, "html.parser")
imageLocation = response.find("img", {"alt": "Captcha image"})["src"]
captchaUrl = url1 + imageLocation
urlretrieve(captchaUrl,'img.jpg')
HTML:
  <div class="page">
   <form action="/gate" method="post">
    <img alt="Captcha image" src="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAYABgAAD//gA7Q1JFQVRPUjogZ2Qtan........amz29hK6kFyNqgHueBTbaEC+MKMNtpAkQB9TyT+gqHVf9RF/13T+dSxf8hXUf+uq/+gCgyfxl/wApvVfzpTE3qv51DRQakpib1X86Tym9V/OozSd6QEhib1X86TyW9V/OozTaYE3kt6r+dHkt6r+dRUnegCXyWz1X86XyW9V/Ooe9LQBL5Leq/nRUVFAH/9ky"/>
    <input autofocus="" name="captcha" type="text"/>
    <input name="captchaData" type="hidden" value="1554139767.64d8ba0c7a9dc0fff1ca1c5e2b622c05.0d0ef2fa1b53692cae5ce0e4481293d6"/>
    <input name="ret" type="hidden" value="/"/>
    <input type="submit" value="Войти"/>
   </form>
  </div>
 </body>
</html>

0 个答案:

没有答案