如何获取许多网站的缩略图?

时间:2011-12-05 05:08:54

标签: python perl mechanize

我有2500个网站的列表,需要获取它们的缩略图截图。我该怎么做?

我可以尝试用Perl或Python解析网站,Mechanize会是一件好事。但我对Perl并不那么有经验。

1 个答案:

答案 0 :(得分:10)

这是Perl解决方案:

  use WWW::Mechanize::Firefox;
  my $mech = WWW::Mechanize::Firefox->new();
  $mech->get('http://google.com');

  my $png = $mech->content_as_png();

来自文档:

  

返回给定的标签或呈现为的当前页面   PNG图片。

     

所有参数都是可选的。 $ tab默认为当前选项卡。如果   给出坐标,该矩形将被剪切掉。该坐标   应该是一个带有四个常用条目的哈希值,left,top,width,height。

     

这是特定于WWW :: Mechanize :: Firefox。

     

目前,Firefox和Perl之间的数据传输已完成   Base64编码。找到必要的东西是有益的   使JSON更优雅地处理二进制数据。