使用Perl进行虚拟屏幕抓取

时间:2012-07-31 16:26:29

标签: python perl imagemagick screen-scraping mechanize

是否可以在Perl或Python中进行虚拟屏幕抓取?假设我有一个登录页面,一旦我输入用户名或密码,它就会转到另一个身份验证页面,我必须写一个Captcha读取的内容。现在使用Mechanize或类似工具,我可以自动完成第一步。但是,对于第二步,是否可以通过Perl捕获验证码页面的屏幕截图(虚拟,因为我们并未真正在浏览器中加载页面)?一旦完成,也许我可以自动化验证码阅读工具(谷歌有一个),它将尝试阅读它。 (所有这些验证码页面都会将验证码图像放在固定大小的固定位置,因此我可以使用Imagemagick裁剪屏幕截图的这一部分并提供给Google工具。这需要一些试运行才能找到截图的哪个部分包含验证码)。那有可能吗?

2 个答案:

答案 0 :(得分:0)

您根本不需要模拟屏幕或做任何事情。只需跟踪CAPTCHA请求其图像数据的位置并自行下载 - 您将拥有准备好的图像文件。

答案 1 :(得分:0)

我最喜欢的验证码旁路是deathbycaptcha。他们有大多数语言的API。还有另一项服务可以帮助您解决验证码以获得未来解决方案的信誉,但我现在还记不起它的名称。