apache nutch dir已创建,但结果为空

时间:2014-05-15 04:12:55

标签: apache web solr web-crawler nutch

我的输出如下..没有错误,没有结果.... $ ./crawl urls -dir crawl -depth 3 -topN 5 cygpath:无法转换空路径 注射器:从2014-05-15 09:25:20开始 Injector:crawlDb:-dir / crawldb 注射器:urlDir:urls 注入器:将注入的URL转换为爬网数据库条目。 HADOOP-7682补丁:实例化变通方法文件系统 Injector:过滤器拒绝的网址总数:1 注入器:标准化和过滤后注入的URL总数:0 Injector:将注入的url合并到crawl db中。 注入器:覆盖:false 注入器:更新:false 注射器:在2014-05-15 09:25:23完成,经过时间:00:00:03

0 个答案:

没有答案