使用海葵从网站获取网址列表时出错

时间:2012-09-04 08:51:14

标签: ruby anemone

代码:

require 'anemone'
Anemone.crawl("http://www.example.com/") do |anemone|
  anemone.on_every_page do |page|
    puts page.url
  end
end

当我尝试这个代码时,我应该得到该网站上所有网址的列表,但我得到的只是网站的名称。什么可能是错误,我如何得到所有网址的列表?

1 个答案:

答案 0 :(得分:0)

我想海葵不能跟随重定向或类似的事情,因为“http://example.com”会将我重定向到其他网站上。您是否尝试过抓取其他网站?例如http://stackoverflow.com