我将以这种方式使用.htaccess阻止所有美国IP:
<Limit GET HEAD POST>
order deny,allow
deny from 3.0.0.0/8
deny from 4.0.0.0/25
deny from 4.0.0.128/26
deny from 4.0.0.192/28
deny from 4.0.0.208/29
....
allow from all
</Limit>
在阻止所有美国IP后,Google是否能够访问我的网站并将其编入索引?
编辑:对于歧义感到抱歉,但我希望 Google为我的网站编制索引。
答案 0 :(得分:13)
虽然谷歌的服务器遍布全球,但很难说搜索引擎的机器人主要来自哪里。我建议阻止IP范围,但添加一个与搜索机器人User-Agent
匹配的排除条款,如:
SetEnvIfNoCase User-Agent (googlebot|bingbot|yahoo!\sslurp) is_search_bot
<Directory /docroot>
Order Deny,Allow
Deny from 3.0.0.0/8
Deny from 4.0.0.0/25
Deny from 4.0.0.128/26
Deny from 4.0.0.192/28
Deny from 4.0.0.208/29
Allow from env=is_search_bot
</Directory>
答案 1 :(得分:1)
我不这么认为,但是如果你真的没有谷歌索引它,那么使用robot.txt文件,所以它不索引它。 robot.txt将是
User-agent: googlebot Disallow: /directory/
如果这只是阻止美国IP的问题,那就是你可能很好,因为谷歌在许多不同的地方都有数据中心,而不仅仅是美国。这意味着谷歌仍可能将其编入索引。
答案 2 :(得分:0)
虽然谷歌有很多数据中心,但他们所有的机器人都在美国,所以如果你阻止我们的话,谷歌将无法扫描你的网站
答案 3 :(得分:0)
如果您无法访问域根目录,只需使用此meta tag来阻止google bot索引特定页面:
<meta name="googlebot" content="noindex">
如果您的网站已经由Google抓取工具编入索引,请遵循指南Remove your own content from Google search results
答案 4 :(得分:0)
访问权限:https://www.google.com/webmasters/
您需要所有信息。
在这里,Google教你如何阻止你的网站的Googlebot索引: https://support.google.com/webmasters/answer/93708
关于您的问题,我认为如果您屏蔽所有美国IP地址,“Google其他国家/地区”必须访问并为您的网站编制索引,那么他必须与Google美国同步。