我需要使用Ruby中的Capybara将网页中的所有HTML标记提取到数组中而不使用标记内的数据
答案 0 :(得分:1)
您可以使用nokogiri gem。
require 'nokogiri'
require 'open-uri'
# Fetch and parse HTML document
doc = Nokogiri::HTML(open('http://www.google.co.in'))
# To list all anchor tags, do:
doc.search('a').each{ |x| puts x.inspect }
答案 1 :(得分:0)
在Capybara试试这个
find(:xpath, "//*")