Question

我需要使用Ruby中的Capybara将网页中的所有HTML标记提取到数组中而不使用标记内的数据

Answer 1

您可以使用nokogiri gem。

require 'nokogiri'
require 'open-uri'

# Fetch and parse HTML document
doc = Nokogiri::HTML(open('http://www.google.co.in'))

# To list all anchor tags, do:
doc.search('a').each{ |x| puts x.inspect }

Answer 2

在Capybara试试这个

find(:xpath, "//*")

从Ruby中的特定页面中提取所有HTML标记

2 个答案: