如何保护网站免受(谷歌)缓存?

时间:2011-06-06 11:58:06

标签: php

我想隐藏一些公开内容(例如谷歌缓存页面)。有可能吗?

8 个答案:

答案 0 :(得分:26)

在网页的<head>部分添加以下HTML标记,以防止Google显示网页的缓存链接。

<META NAME="ROBOTS" CONTENT="noarchive">

查看Google webmaster central | Meta tags,了解Google了解的其他元标记。

答案 1 :(得分:7)

选项1:在Google搜索结果中停用“显示缓存网站”链接

如果您想阻止Google归档您的网站,请在您的部分添加以下元标记:

<meta name="robots" content="noarchive">

如果您的网站已由Google缓存,则可以使用Google's URL removal tool请求删除该网站。有关如何使用此工具的更多说明,请参阅Google网站管理员中心的"Remove a page or site from Google's search results"

选项2:完全从Google索引中删除网站

警告!以下方法将完全从Google索引中删除您的网站。仅在您不希望自己的网站显示在Google搜索结果中时才使用它。

要阻止(“保护”)您的网站访问Google的缓存,您可以使用robots.txt。有关如何使用此文件的说明,请参阅"Block or remove pages using a robots.txt file"

原则上,您需要创建一个名为robots.txt的文件,并从您网站的根文件夹(/robots.txt)提供该文件。示例文件内容:

User-agent: *
Disallow: /folder1/

User-Agent: Googlebot
Disallow: /folder2/

此外,请考虑将HTML文档中的robots 元标记设置为noindex"Using meta tags to block access to your site"):

  • 要阻止所有漫游器将您的网站编入索引,请设置<meta name="robots" content="noindex">
  • 有选择地仅阻止Google ,请设置<meta name="googlebot" content="noindex">

最后,请确保您的设置确实有效,例如使用Google Webmaster Tools

答案 2 :(得分:2)

答案 3 :(得分:1)

您可以使用robots.txt文件请求您的网页未编入索引。谷歌和其他声誉良好的服务将坚持这一点,但不是全部。

确保您的网站内容未被任何搜索引擎或类似服务编入索引或缓存的唯一方法是阻止访问该网站,除非用户有密码。

使用HTTP Basic Auth最容易实现。如果您正在使用Apache Web服务器,那么有很多关于如何配置它的教程(example)。一个好的搜索词是htpasswd

答案 4 :(得分:1)

执行此操作的简单方法是使用<meta name="robots" content="noarchive"/>

您还可以使用robots.txt文件获得类似的效果。

有关详细说明,请参阅official google blog on the robot's execution policy

答案 5 :(得分:0)

  

我想向公众隐瞒一些内容......

使用登录系统查看内容。

  

...(就像谷歌缓存页面一样)。

配置robots.txt以拒绝谷歌机器人。

答案 6 :(得分:0)

如果您想限制哪些人可以看到内容,请将其保护在某种形式的身份验证机制背后(例如密码保护,即使它只是HTTP Basic Auth)。

具体方法取决于服务器提供的选项。

答案 7 :(得分:0)

您还可以在响应中添加此HTTP标头,而不是需要更新html文件:

X-Robots-Tag: noarchive

例如对于Apache:

Header set X-Robots-Tag "noarchive"

另请参阅:https://developers.google.com/search/reference/robots_meta_tag?csw=1