如何在Ruby上使用Nokogiri在终端上查看HTML?

时间:2019-04-11 09:32:12

标签: html ruby parsing ubuntu nokogiri

我正在尝试使用Ubuntu上的Ruby(2.5.1)上的Nokogiri解析Wikipedia的HTML页面,这是我的代码以及终端机回复的内容:

关于问题来自何方的任何想法?我在之前尝试过捆绑安装,但似乎没有任何效果。预先感谢您带来的任何帮助!

require 'open-uri'
require 'nokogiri'

page = Nokogiri::HTML(open('https://en.wikipedia.org'))   
puts page   # => Nokogiri::HTML::Document```



```asus@asus-X75VD:~/THP/jour8/lib$ ruby test8.rb 
Nokogiri::HTML::Document```


1 个答案:

答案 0 :(得分:0)

您知道,Nokogiri具有等效的命令行功能,可让您检索页面并在IRB中进行操作,因此您无需准备编写代码就可以搞乱。如果输入:

nokogiri https://en.wikipedia.org

在终端提示下,您将进入IRB,并能够执行以下操作:

irb(main):002:0> @doc.to_s[0..10]
=> "<!DOCTYPE h"

或:

irb(main):005:0> @doc.to_s.size
=> 76139

您可以查看该页面并将其写入磁盘,所有正常的事情。