使用Ruby selenium-webdriver

时间:2017-01-22 10:13:03

标签: ruby selenium-webdriver web-scraping

如何使用Ruby selenium-webdriver获取整个网页(不仅仅是html)?我试过这个,但这段代码只是获取html文件,而不是img和css文件或其他。

driver = Selenium::WebDriver.for(:firefox)
driver.get(URL_of_page_to_save)
file = File.new(filename, "w")
file.puts(driver.page_source)
file.close

1 个答案:

答案 0 :(得分:0)

硒不是解决问题的完整工具,尽管您处在正确的轨道上。

签出Nokogiri。它应该允许您解析文档的HTML,以分别下载所需的关联文件。