我有一个使用Django构建的网站。使用settings.py文件,我发送自己从网站生成的错误消息,部分是为了让我可以看到我是否犯了任何错误。
我不时会得到相当奇怪的错误,而且他们似乎主要是在网站的同一区域(我写了一些小教程,试图解释我如何设置Django博客引擎)。
我得到的错误看起来就像是我可以用拼写错误做的事情。
例如,这两个错误非常接近。我从来没有在这些页面上使用'x'或'post'作为变量。
'/ blog_engine /页面/步骤-10-子模板/ {{+ x.get_absolute_url +}} /'
'/ blog_engine /页面/步骤-10-子模板/ {{+ post.get_absolute_url +}} /'
用户代理是:
'HTTP_USER_AGENT':'Mozilla / 5.0(兼容; Purebot / 1.1; + http://www.puritysearch.net/)',
我认为它是一个刮板机器人,但我无法弄清楚它们能够通过这种攻击获得什么。
冒着听起来很愚蠢的风险,我该怎么办?这是一次黑客攻击还是只是试图复制我的网站?
编辑:我会按照已经给出的建议,但我真的很好奇为什么有人会运行这样的脚本。他们只是想复制。它不会访问管理页面甚至任何表单。除了潜在的剽窃之外,试图挖掘并找到内容似乎是无害的?
答案 0 :(得分:8)
从您的USER_AGENT
信息看来,这是来自puresearch.net的网络蜘蛛。
robots.txt
文件。在robots.txt
中提及您的规则。您可以说抓取工具可以阻止您网站的某些繁忙部分等。这样您就不会完全阻止抓取工具(您的网站变得流行所需),同时确保您的用户在您的网站上获得快速体验。
答案 1 :(得分:4)
项目HoneyPot将此机器人列为恶意机器人http://www.projecthoneypot.org/ip_174.133.177.66(查看那里的评论),您应该做的是禁止该IP和/或代理。