Nutch 1.2没有要获取的URL

时间:2014-05-09 01:45:40

标签: nutch web-crawler

我已经安装了cygwin,在cygwin目录中复制了nutch-1.2。

使用http://amac4.blogspot.co.uk

创建了nutch-1.2 / urls / seed.txt

regex-urifilter

# accept anything else
+^http://amac4.blogspot.co.uk/

nutch-site有

    <configuration>
    <name>http.agent.name</name>
    <value>My Nutch Spider</value>
    </configuration>

我在这里缺少什么。

0 个答案:

没有答案