我需要使用scrapy从网站提取数据,但在此之前我应该登录。 登录页面有验证码,那我该怎么办?
网站:tinyz.us
用户名字段:
<input class="en" name="login_user" type="text">
用户名字段:
<input class="en" name="login_password" type="password">
答案 0 :(得分:1)
您可以先通过光学字符识别(OCR)然后再使用 CAPTCHA解决API。请参阅本书第7章:https://www.packtpub.com/big-data-and-business-intelligence/web-scraping-python
还有解决验证码的在线服务。例如: https://anti-captcha.com/