通过使用Rails和poltergeist获取页面源代码

时间:2013-11-28 16:41:56

标签: ruby-on-rails ruby

如何使用poltergeist和poltergeist设置Rails以获取特定页面的页面源。与下面的代码类似。

require 'selenium-webdriver'
require 'nokogiri'

driver = Selenium::WebDriver.for :firefox
driver.get "http://www.google.com/"

doc = Nokogiri::HTML(driver.page_source)

或其他设置,但重点不是打开浏览器,也不需要交互,只需渲染javascript。

1 个答案:

答案 0 :(得分:3)

Poltergeist意味着与Capybara一起使用。

这就是将Capybara用于远程服务器的方法:https://github.com/jnicklas/capybara#calling-remote-servers

这是一个有效的片段:

require 'capybara'
require 'capybara/poltergeist'

Capybara.current_driver = :poltergeist
Capybara.app_host = 'http://www.google.com'
Capybara.visit('/')
puts Capybara.page.body