从Ruby中的特定页面中提取所有HTML标记

时间:2016-05-29 07:23:50

标签: ruby-on-rails ruby capybara

我需要使用Ruby中的Capybara将网页中的所有HTML标记提取到数组中而不使用标记内的数据

2 个答案:

答案 0 :(得分:1)

您可以使用nokogiri gem。

require 'nokogiri'
require 'open-uri'

# Fetch and parse HTML document
doc = Nokogiri::HTML(open('http://www.google.co.in'))

# To list all anchor tags, do:
doc.search('a').each{ |x| puts x.inspect }

答案 1 :(得分:0)

在Capybara试试这个

find(:xpath, "//*")