我正在尝试将domainatrix与nokogiri一起使用,并且我正在努力。作为ruby的新手,我已经尝试了Domainatrix.parse函数的每个语法变体,我可以让href正确解析。它们在“puts”命令期间打印,但是当我取消注释domainatrix代码时,问题就开始了:
require 'rubygems'
require 'domainatrix'
require 'anemone'
require 'open-uri'
require 'nokogiri'
doc = Nokogiri::HTML(open("http://www.cnn.com"))
doc.xpath('//a/@href').each do |node|
linkage = node.text
puts linkage
url = Domainatrix.parse(linkage)
print url.domain
print url.public_suffix
end
有人对此有任何想法吗?我认为这只是一个语法问题,或者我不能使用Domainatrix函数,我正在使用它?
答案 0 :(得分:1)
在一些格式不正确的网址上遇到了障碍。