想知道我做错了什么。这里。
我需要在父页面上打印链接,即使它们用于其他域。然后离开。
require 'anemone'
url = ARGV[0]
Anemone.crawl(url, :depth_limit => 1) do |anemone|
anemone.on_every_page do |page|
page.links.each do |link|
puts link
end
end
end
我做得对不对?
编辑:不输出任何内容。
答案 0 :(得分:0)
这对我有用
require 'anemone'
require 'optparse'
file = ARGV[0]
File.open(file).each do |url|
url = URI.parse(URI.encode(url.strip))
Anemone.crawl(url, :discard_page_bodies => true) do |anemone|
anemone.on_every_page do |page|
links = page.doc.xpath("//a/@href")
if (links != nil)
links.each do |link|
puts link.to_s
end
end
end
end
end