Heritrix3第一次爬网作业

时间:2019-03-05 12:04:31

标签: heritrix

我是新来的。我正在尝试按照https://github.com/internetarchive/heritrix3/wiki/A%20Quick%20Guide%20to%20Running%20Your%20First%20Crawl%20Job

中的步骤执行作业

运行时,似乎无法正常工作。在“报告”中,我看到“爬网状态:已完成-爬网异常退出”,它仍在永久运行。

就我而言,我不理会机器人。

配置中是否还需要更改其他内容?

谢谢!

0 个答案:

没有答案