我正在尝试使用Nokogiri解析一些HTML,但我没有从css
或xpath
方法中获得任何回复。
require 'rubygems'
require 'open-uri'
require 'nokogiri'
doc = Nokogiri::HTML(open("http://www.google.com"))
doc.css('div').each do |div|
puts div.content
end
doc.xpath('//div').each do |div|
puts div.content
end
没有任何内容打印到屏幕上,因此css
和xpath
返回空数组。 Google首页至少有100个div。
doc.to_html
返回:
<!DOCTYPE html>\n\n
doc.validate
返回:
[#<Nokogiri::XML::SyntaxError: no root element>]
我卸载了Nokogiri,并重新安装了“Installing Nokogiri”中提到的libxml2和libxslt。现在一切正常。