谷歌为何添加“此网站可能遭到入侵”的通知

时间:2013-03-07 21:15:54

标签: .htaccess webserver robots.txt

今天早上,我的很多网站都标记了“这个网站可能会被Google妥协”的结果。在我自己的VPS服务器上受我监督的网站。我对它进行了深入的扫描,没有任何不正常的事情。我找到了可疑的htaccess和javascript注入,到目前为止没有任何错误。

昨天,我将一个htaccess文件放到我的web根目录中,以确保没有sql,javascript,base64和任何其他可疑的黑客攻击解决方案可能会攻击我的服务器。

所以我怀疑Google添加“此网站可能已被盗用”,因为我将此保护添加到我的所有网站。

有这个htaccess的内容:

RewriteEngine On
RewriteCond %{REQUEST_URI} !^/robots.txt
RewriteCond %{REQUEST_URI} !^/sitemap.xml

RewriteCond %{HTTP_USER_AGENT} ^-?$ [OR] 
RewriteCond %{HTTP_USER_AGENT} ^[bcdfghjklmnpqrstvwxz\ ]{8,}|^[0-9a-z]{15,}|^[0-9A-Za-z]{19,}|^[A-Za-z]{3,}\ [a-z]{4,}\ [a-z]{4,} [OR]
RewriteCond %{HTTP_USER_AGENT} ^<sc|<\?|^adwords|@nonymouse|Advanced\ Email\ Extractor|almaden|anonymous|Art-Online|autoemailspider|blogsearchbot-martin|CherryPicker|compatible\ \;|Crescent\ Internet\ ToolPack|Digger|DirectUpdate|Download\ Accelerator|^eCatch|echo\ extense|EmailCollector|EmailWolf|Extractor|flashget|frontpage|Go!Zilla|grub\ crawler|HTTPConnect|httplib|HttpProxy|HTTP\ agent|HTTrack|^ia_archive|IDBot|id-search|Indy\ Library|^Internet\ Explorer|^IPiumBot|Jakarta\ Commons|^Kapere|Microsoft\ Data|Microsoft\ URL|^minibot\(NaverRobot\)|^Moozilla|^Mozilla$|^MSIE|MJ12bot|Movable\ Type|NICErsPRO|^NPBot|Nutch|Nutscrape/|^Offline\ Explorer|^Offline\ Navigator|OmniExplorer|^Program\ Shareware|psycheclone|PussyCat|PycURL|python|QuepasaCreep|SiteMapper|Star\ Downloader|sucker|SurveyBot|Teleport\ Pro|Telesoft|TrackBack|Turing|TurnitinBot|^user|^User-Agent:\ |^User\ Agent:\ |vobsub|webbandit|WebCapture|webcollage|WebCopier|WebDAV|WebEmailExtractor|WebReaper|WEBsaver|WebStripper|WebZIP|widows|Wysigot|Zeus|Zeus.*Webster [NC,OR]
RewriteCond %{HTTP_USER_AGENT} ^curl|^Fetch\ API\ Request|GT\:\:WWW|^HTTP\:\:Lite|httplib|^Java/1.|^Java\ 1.|^LWP|libWeb|libwww|^PEAR|PECL\:\:HTTP|PHPCrawl|python|Rsync|Snoopy|^URI\:\:Fetch|WebDAV|^Wget [NC]
RewriteRule (.*) - [F]

RewriteCond %{REQUEST_METHOD} (GET|POST) [NC]
RewriteCond %{QUERY_STRING} ^(.*)(%3C|<)/?script(.*)$ [NC,OR]
RewriteCond %{QUERY_STRING} ^(.*)(%3D|=)?javascript(%3A|:)(.*)$ [NC,OR]
RewriteCond %{QUERY_STRING} ^(.*)document\.location\.href(.*)$ [OR]
RewriteCond %{QUERY_STRING} ^(.*)(%3D|=)http(%3A|:)(/|%2F){2}(.*)$ [NC,OR]
RewriteCond %{QUERY_STRING} ^(.*)base64_encode(.*)$ [OR]
RewriteCond %{QUERY_STRING} ^(.*)GLOBALS(=|[|%[0-9A-Z]{0,2})(.*)$ [OR]
RewriteCond %{QUERY_STRING} ^(.*)_REQUEST(=|[|%[0-9A-Z]{0,2})(.*)$ [OR]
RewriteCond %{QUERY_STRING} ^(.*)(SELECT(%20|\+)|UNION(%20|\+)ALL|INSERT(%20|\+)|DELETE(%20|\+)|CHAR\(|UPDATE(%20|\+)|REPLACE(%20|\+)|LIMIT(%20|\+))(.*)$ [NC]
RewriteRule (.*) - [F]

此文件中有很多关于黑客术语的关键字... Google有没有办法查看htaccess文件?

我是否应该仅使用robots.txt封锁google for this htaccess,或者我是否可以/应该直接在htaccess中添加一行代码来阻止Google扫描此文件...?

您怎么看?

1 个答案:

答案 0 :(得分:1)

如果从外面看到.htaccess,则表示您遇到严重问题。 任何人通过http访问该网站时,永远不会显示该文件。在robots.txt中阻止它只会阻止表现良好的机器人查看它。但是忽略robots.txt的机器人仍然可以访问。

如果您怀疑.htaccess是问题的原因,您需要确保无法提供。这是Apache的默认设置,但如果您正在使用权限,我想您可能已经暴露了它。如果你这样做,你需要解决这个问题。

我认为你需要在其他地方查找Google的“此网站可能已被入侵”消息的原因。对[此网站可能遭到入侵]的Google(或Bing)搜索会显示有关该警告可能出现原因的大量信息。