我需要自动化这样的事情:
我看到https://developer.mozilla.org/en/Command_Line_Options但我找不到一个选项来调用命令“将页面保存为...(在模式网页完成中)”。所以我可以拥有显示页面所需的所有css,js,xml和相关文件。
我知道一些Python,如果我找到一种与Firefox“交谈”的方法,我可以使用它。 webbrowser模块在这里没有帮助,因为它不允许保存页面:http://docs.python.org/library/webbrowser.html
我对任何解决方案都持开放态度。
平台:Linux,但如果没有别的办法,我可以使用另一种方式。
重要:我不能只检索Web服务器提供的HTML,因为我需要用于查看浏览器呈现的页面的所有css,js,图像和文件。例如,图像可能未在HTML中链接,但在呈现页面时执行的 js 引用。我认为可以检索此图像的唯一方法是执行页面,就像我是浏览器一样,然后从结果页面(而不是原始页面)获取所有文件。
答案 0 :(得分:4)
也许来自Selenium工具集的内容适合您。
Selenium IDE是Selenium脚本的集成开发环境。它作为Firefox扩展实现,允许您记录,编辑和调试测试。 Selenium IDE包含整个Selenium Core,允许您在实际环境中轻松快速地记录和回放测试。
答案 1 :(得分:1)
答案 2 :(得分:0)
如果您尝试使用Python将某些URL保存到文件中,那么一个好的答案可能是urllib.urlretrieve
答案 3 :(得分:0)
查看iMacros软件:http://www.iopus.com/imacros/ 它的firefox插件是免费的。