获取网页来源

时间:2012-06-14 00:28:59

标签: ruby shell firefox

我正在尝试获取网页来源。 我用过:

 $ curl --user name:password www.example.com

但是这给了我登录页面的页面源。我希望在登录后获取页面源。

我也尝试过但没有成功。

我不能使用nokogiri和其他红宝石等等。

有什么方法可以从命令行使用firefox来获取页面源代码,还是有其他方法可以获取页面源代码?

由于

1 个答案:

答案 0 :(得分:1)

  

有什么方法可以从命令行使用firefox来获取页面源...

您可以通过Selenium WebDriver编写Firefox(以及其他浏览器)脚本。对于Ruby绑定,请参阅RubyBindings


编辑:你说你不能使用“其他Ruby宝石”,所以我猜Selenium Web Driver不是一个选项。还有Selenium IDE,这是你可以使用的Firefox扩展,基本上记录了你自己登录的宏。然后你可以从命令行调用测试。这可能会有所帮助,也可能没有帮助,具体取决于您正在尝试做什么。


或者,您可以使用sending a POST request使用您需要的值使用cURL登录。如果您需要获取除请求后返回的第一页之外的任何内容,则需要使用--cookie-jar选项保存会话以用于后续请求。