应用错误收集

Robots.txt只是阻止Googlebot查看页面内容。但是，即使有人链接到您的页面，即使Google没有看到内容，Google也知道该目标URL上有一个网页。

如果有足够的人链接到该页面，则Google可能决定添加该页面并将其显示在索引中。 Google经常会从与其链接的内容和链接的锚文本中收集该网页的上下文。

如果您确实不希望URL出现在Google索引中，则有两种建议的方法。

使用NOINDEX命令向页面添加robots meta tag。 注意：，您必须允许Google抓取其URL才能看到NOINDEX命令。因此，您必须在robots.txt文件中撤消disallow命令
将HTTP基本身份验证添加到页面

这两种方法都会确保Google不会将URL添加到索引中。但是，Google仍会不时抓取该URL。

有关更多信息，Google代表John Mueller最近表示了此on Twitter。

... robots.txt肯定会阻止内容的抓取（如果不允许），但不一定要为网址建立索引。 [但是，]没有内容，很难排名