我正在尝试使用Ubuntu上的Ruby(2.5.1)上的Nokogiri解析Wikipedia的HTML页面,这是我的代码以及终端机回复的内容:
关于问题来自何方的任何想法?我在之前尝试过捆绑安装,但似乎没有任何效果。预先感谢您带来的任何帮助!
require 'open-uri'
require 'nokogiri'
page = Nokogiri::HTML(open('https://en.wikipedia.org'))
puts page # => Nokogiri::HTML::Document```
```asus@asus-X75VD:~/THP/jour8/lib$ ruby test8.rb
Nokogiri::HTML::Document```
答案 0 :(得分:0)
您知道,Nokogiri具有等效的命令行功能,可让您检索页面并在IRB中进行操作,因此您无需准备编写代码就可以搞乱。如果输入:
nokogiri https://en.wikipedia.org
在终端提示下,您将进入IRB,并能够执行以下操作:
irb(main):002:0> @doc.to_s[0..10]
=> "<!DOCTYPE h"
或:
irb(main):005:0> @doc.to_s.size
=> 76139
您可以查看该页面并将其写入磁盘,所有正常的事情。