标签: solr nutch
在哪些情况下url进入db_unfetched阶段。 url不满意crawlurlfilter.txt也会进入db_unfetched状态。
答案 0 :(得分:3)
以下网址标记为db _ unfetched:
unfetched
crawlurlfilter.txt不允许网址有资格获取。因此,网址将保持db_unfetched。
crawlurlfilter.txt
db_unfetched