我有2500个网站的列表,需要获取它们的缩略图截图。我该怎么做?
我可以尝试用Perl或Python解析网站,Mechanize会是一件好事。但我对Perl并不那么有经验。
答案 0 :(得分:10)
这是Perl解决方案:
use WWW::Mechanize::Firefox;
my $mech = WWW::Mechanize::Firefox->new();
$mech->get('http://google.com');
my $png = $mech->content_as_png();
来自文档:
返回给定的标签或呈现为的当前页面 PNG图片。
所有参数都是可选的。 $ tab默认为当前选项卡。如果 给出坐标,该矩形将被剪切掉。该坐标 应该是一个带有四个常用条目的哈希值,left,top,width,height。
这是特定于WWW :: Mechanize :: Firefox。
目前,Firefox和Perl之间的数据传输已完成 Base64编码。找到必要的东西是有益的 使JSON更优雅地处理二进制数据。