我正在为网站database界面编写文档。是否可以编写一个脚本,在执行时,获取网站的最新快照并将其保存为图像文件?
注意:我正在使用标签ruby,bash和python,因为这些是我们小组中使用的语言(连同R和FORTRAN;对于运动,我会设置100点奖励如果有人可以发布FORTRAN解决方案)。
更新:正如@birryree所说,previous question提供了答案。考虑到FORTRAN的报价仅适用于运动,也许这是重复的?
答案 0 :(得分:3)
WkHTMLtoPDF包含二进制文件,它还可以使用webkit的渲染器将网页转换为图像。
答案 1 :(得分:2)
您可能会觉得这很有用 - an interesting Python project which processes a queue of URLs and exports the browser screenshots to your server。
答案 2 :(得分:2)
是否可以拍摄网页快照并将其另存为带图像的HTML文件?因为那是微不足道的。
wget -m -p http://www.example.com/example.html
答案 3 :(得分:2)
这可以用硒来完成。首先设置seleniumrc。然后使用任何语言apis,使用captureScreenshot()方法。这是java中的一个例子:
请注意,selenium需要一个显示来呈现,但你也可以在Linux上使用像Xvfb这样的虚拟帧缓冲区(可能默认安装)
我还推荐使用seleniumIDE firefox插件,因为它基本上可以用任何语言为你编写代码。
答案 4 :(得分:2)
CutyCapt(命令行)做得很好。
CutyCapt --url=http://www.example.org --out=example.png