如何使用ruby从网页中捕获文本

时间:2013-11-13 21:29:54

标签: ruby testing automated-tests

我正在运行一个用Ruby编写的自动化测试脚本,我在其中获得了一个结果页面,我想捕获页面上的一些文本并将它们打印在一个文件中。任何人都可以协助这项工作吗?

1 个答案:

答案 0 :(得分:2)

如评论所述,请使用Nokogiri。

使用gem install nokogiri安装。

从example.com打印第一个顶级标题:

require 'nokogiri'
require 'open-uri'
doc = Nokogiri::HTML(open("http://www.example.com/"))
puts doc.css("h1").first

有关查找所需文字的详细信息,请尝试this guide