在我们的网站上有多个404请求。它是攻击还是错误的索引机器人?

时间:2009-05-07 09:22:32

标签: http-status-code-404 webrequest

我们的网站正在接收尝试访问非现有网页的请求。通常只有拼写错误的地址。就像右边的链接是/Info/SiteMap.aspx,但错误的请求是/Inf/SiteMap.aspx,缺少'o'。通常有很多请求,例如一分钟内排20个。全部抛出404。

是一些索引机器人的问题吗?或者是否有人测试我们网站的差距?

有经验或提示吗?

1 个答案:

答案 0 :(得分:1)

是的,请考虑以下事项。

  1. 发送请求的主机的IP地址 - 如果它们是不同但有几个IP,我们可以怀疑它是使用Zombies完成的分布式攻击。

  2. 。如果请求来自同一来源,请检查请求之间的延迟。通常,爬虫在请求之间不会使用极短的时间段。

  3. 索引机器人(Crawlers)不执行“强力”类型索引。他们只是从一个页面检索链接,并逐页递归遍历。所以原因应该不是索引机器人。

  4. 检查是否有任何模式。我的意思是顺序命名模式等。

  5.   

    EX:/Inf/SiteMap.aspx,/Infa/SiteMap.aspx,/Infb/SiteMap.aspx