标签: web web-crawler
据我所知,网络抓取工具可能会使用某些种子作为网址开始重复查找网页,但它是如何发现的,只包含HTML而页面中没有任何链接且没有任何其他网页链接?
答案 0 :(得分:0)
机器人使用多种方式来查找页面(大多数机器人的资源都非常受限制,因此只有主要机器人才能负担得起这里列出的所有内容):