通过Java引用字符串阻止机器人?

时间:2014-01-26 18:31:55

标签: java .htaccess referrer referrer-spam

我的日志中有很多网页点击,它抓取了我网站的大多数顶级网页,并将引荐来源显示为Java版本。

我在引用者中看到了Java版本的不同变体,即Java / 1.6.0_04,Java / 1.4.1_04,Java / 1.7.0_25等。

有时,但并非总是如此,我得到404 / contact /但下面没有其他页面。

根据Project Honeypot

,IP通常总是垃圾收集者和机器人
78.129.252.190 - - [24/Jan/2014:01:28:52 -0800] "GET / HTTP/1.1" 200 6728 "-" "Java/1.6.0_04" 198 7082
78.129.252.190 - - [24/Jan/2014:01:28:55 -0800] "GET /about HTTP/1.1" 301 - "-" "Java/1.6.0_04" 203 352
78.129.252.190 - - [24/Jan/2014:01:28:55 -0800] "GET /about/ HTTP/1.1" 200 29933 "-" "Java/1.6.0_04" 204 30330
78.129.252.190 - - [24/Jan/2014:01:28:56 -0800] "GET /articles-columns HTTP/1.1" 301 - "-" "Java/1.6.0_04" 214 363
78.129.252.190 - - [24/Jan/2014:01:28:57 -0800] "GET /articles-columns/ HTTP/1.1" 200 29973 "-" "Java/1.6.0_04" 215 30370
78.129.252.190 - - [24/Jan/2014:01:28:58 -0800] "GET /contact HTTP/1.1" 301 - "-" "Java/1.6.0_04" 205 354
78.129.252.190 - - [24/Jan/2014:01:28:58 -0800] "GET /contact/ HTTP/1.1" 200 47424 "-" "Java/1.6.0_04" 206 47827

他们在寻找什么?漏洞?

我可以通过Java引荐来阻止这些访问吗?如果是这样,怎么样?有php功能吗?

或者我应该通过IP阻止他们? (我知道怎么做.htaccess,但这是一种不那么主动的方法。)

0 个答案:

没有答案