如何从需要验证码的网站上删除数据?

时间:2015-06-29 22:14:30

标签: r web-scraping

每次访问网页时,是否可以从需要验证码的网站自动抓取数据?例如,当网站显示代码图片并要求您输入图片中显示的内容时。我正在使用rvest包。这可能吗?

1 个答案:

答案 0 :(得分:3)

你要做的就是击败CAPTCHAs。这可能但很难。这是垃圾邮件发送者最难的工作 - 提出足够智能的算法来正确填写这些字段。这不是你应该做的事情,这些验证码的重点是阻止非人类的访问。如果你很聪明并且有足够的动力来弄清楚如何以编程方式回答这些问题,那么你可以赚到更多钱而不是你想做的事情:)

有些网站提供直接API,这是您应该与其数据进行交互的方式。但是通过刮擦来越过CAPTCHA并不容易。