我的日志中有很多网页点击,它抓取了我网站的大多数顶级网页,并将引荐来源显示为Java版本。
我在引用者中看到了Java版本的不同变体,即Java / 1.6.0_04,Java / 1.4.1_04,Java / 1.7.0_25等。
有时,但并非总是如此,我得到404 / contact /但下面没有其他页面。
根据Project Honeypot ,IP通常总是垃圾收集者和机器人78.129.252.190 - - [24/Jan/2014:01:28:52 -0800] "GET / HTTP/1.1" 200 6728 "-" "Java/1.6.0_04" 198 7082
78.129.252.190 - - [24/Jan/2014:01:28:55 -0800] "GET /about HTTP/1.1" 301 - "-" "Java/1.6.0_04" 203 352
78.129.252.190 - - [24/Jan/2014:01:28:55 -0800] "GET /about/ HTTP/1.1" 200 29933 "-" "Java/1.6.0_04" 204 30330
78.129.252.190 - - [24/Jan/2014:01:28:56 -0800] "GET /articles-columns HTTP/1.1" 301 - "-" "Java/1.6.0_04" 214 363
78.129.252.190 - - [24/Jan/2014:01:28:57 -0800] "GET /articles-columns/ HTTP/1.1" 200 29973 "-" "Java/1.6.0_04" 215 30370
78.129.252.190 - - [24/Jan/2014:01:28:58 -0800] "GET /contact HTTP/1.1" 301 - "-" "Java/1.6.0_04" 205 354
78.129.252.190 - - [24/Jan/2014:01:28:58 -0800] "GET /contact/ HTTP/1.1" 200 47424 "-" "Java/1.6.0_04" 206 47827
他们在寻找什么?漏洞?
我可以通过Java引荐来阻止这些访问吗?如果是这样,怎么样?有php功能吗?
或者我应该通过IP阻止他们? (我知道怎么做.htaccess,但这是一种不那么主动的方法。)