我创建了一个只能通过$ _GET
收到的令牌/通行证访问的php页面因此,如果您转到以下网址,您将获得一个通用页面或空白页面
但是,如果您使用带有令牌的链接,则会显示特殊内容
http://fakepage11.com/secret_page.php?token=344ee833bde0d8fa008de206606769e4
当然这不如登录页面安全,但我唯一关心的是创建一个不可索引的动态页面,只能通过提供的链接访问。
动态网页是否依赖于由谷歌和其他搜索引擎索引的$ _GET变量?
如果是这样,会包含以下内容足以隐藏它吗?
Robots.txt User-agent: * Disallow: /
元数据:<META NAME="ROBOTS" CONTENT="NOINDEX">
即使我输入谷歌:
站点:fakepage11.com /
谢谢!
答案 0 :(得分:1)
如果您的网页无法被发现,则不会将其编入索引。
by&#34;可被发现&#34;我们的意思是:
因此,在您的情况下,通过使用get参数进行访问,您可以实现1但不一定是2,因为有人可能引用该链接,因此&#34;隐藏&#34;页。
您可以使用您提供的robots.txt
,在这种情况下,该页面不会被尊重该页面的机器人编入索引(并非所有人都会这样做)。没有索引你的页面并不意味着&#34;隐藏&#34;页面网址不会在野外。
另外一个问题 - 根据您的要求 - 是您使用未加密的HTTP,这意味着您的隐藏&#34;页面的URL和内容对服务器和用户之间的每个服务器都是可见的。
除了搜索引擎外,例如在Skype或Facebook Messenger中交换URL时,请注意某些服务正在缓存/解析内容。在这种情况下,他们将访问URL并尝试提取元数据,并在适用时缓存它。当然,这种情况不会将您的URL暴露给公众,但它会暴露给这些服务的系统,并且它们会显示您拥有的内容&#34;隐藏&#34;。
<强>更新强>: 另一个需要考虑的问题是暴露一个隐藏的&#34;页面链接到另一个页面。在这种情况下,在托管链接网址的服务器的日志中,您的网页将被视为推介,因此可见,也会扩展到Google Analytics等。因此,如果您想保持隐身,请不要链接到其他网页。隐藏的页面。
答案 1 :(得分:1)
如果搜索引擎机器人以某种方式找到与令牌的链接¹,它可能会抓取并将其编入索引。
如果您使用robots.txt
禁止抓取该网页,则符合搜索引擎机器人不会抓取该网页,但他们仍可能会将其网址编入索引(然后该网址可能会显示在{ {1}}搜索)。
如果您使用site:
- meta
禁止建立索引页面,则符合搜索引擎机器人不会对该网页编制索引,但他们仍可能抓取该网页。
你不能同时拥有:如果你不允许抓取,那么合规机器人永远不会知道你也禁止索引,因为他们不允许访问该页面来查看你的robots
- meta
元素。
¹搜索引擎可以通过无数方式找到链接。例如,访问该网页的用户可能会使用a browser toolbar that automatically sends all visited URLs to a search engine。