现在这听起来有点奇怪!在过去的几个月里,我们看到我们的日志文件中出现了错误(我编写了一个解析器,它为我们提供了一个GUI界面来查看损坏的请求)。以下是昨天出现的一个例子:
http://www.chambresdhotes.org/cgi-bin/links/jump.cgi?ID=141644
寻找:
http://www.chambresdhotes.org/Detailed/151969.html
我无法在该页面上看到对151969.html
的任何引用...所以它究竟是从哪里获得的?
起初我以为它只是一只蜘蛛的随机嘘声,但它来自过去几个月超过2000种不同的IP,这让我相信它的其他东西。
有没有人有任何建议?它让我疯了! (我们正在对网站进行更改,但我们仍然会收到类别页面上的旧图片请求,这些图片已在6个月前删除了!)
更新:另一个例子:
推荐网址:http://www.chambresdhotes.org/ 要求:http://www.chambresdhotes.org/fr/apartment-verdun.html
这个页面是3年多以前的,所以人们仍然看到它(并点击它上面的链接)。这是完整的日志:
104.223.31.137 - - [16 / Dec / 2015:17:32:30 +0100]“GET /fr/apartment-verdun.html HTTP / 1.1”404 1858 “http://www.chambresdhotes.org/”“Opera / 9.80(Windows NT 6.2; Win64; x64)Presto / 2.12.388版本/ 12.16“
我也看到了很多类似的IP:
104.223.31.179 - - [16 / Dec / 2015:17:32:30 +0100]“GET /fr/apartment-residence-raphael.html HTTP / 1.1”404 1858 “http://www.chambresdhotes.org/”“Opera / 9.80(Windows NT 6.2; Win64; x64)Presto / 2.12.388版本/ 12.16“
由于