如何访问无法访问的链接路径的内容403错误

时间:2019-12-09 08:08:45

标签: http web search directory

Internet上有一些链接,这些链接无法直接访问站点目录。但是Google可以看到这些路径并显示该方向的文件。 有什么方法可以显示该链接路径中的链接列表?

例如。

  • http_://site.com/files/paper.pdf
  •  --
  

Blockquote

... 当键入地址栏时,转到

  

http_://site.com/pic/ //显示错误403禁止访问

但是在Google上搜索时

  

文件类型:pdf网站:htt p://site.co m / files /

结果是: htt p://_site.co m / files / paper.pdf

我要查看与Google搜索引擎相同路径中存在的所有文件吗?

注释:我想查看其他人的网站,而不是我自己的网站。

1 个答案:

答案 0 :(得分:0)

Google只能执行用户的操作。如果目录列表被禁止,则对于Google来说也是一样。唯一的例外是当存在基于请求标头的规则时。通常,用户代理值。您可以更改用户代理标题,以假装自己是Google。这是values they use

但是说实话,我认为您遇到的情况是该文件只是在站点中的某个地方被引用。 Google要做的是经过一个称为“爬网”的过程,该过程或多或少意味着脚本从主页开始,搜索该页面上的所有链接和文件路径,然后跟踪所有链接,直到拥有所有内容为止。如果您进行了同样的操作(有相应的软件和应用程序),则很可能会发现该文件已在网站页面的某处使用或引用。

不允许目录列表是大多数Web服务器上的常见设置。如果路径已知,则可以访问文件,但无法检查文件。它可以防止人们发现您不希望他们知道或根本不知道的文件。但是,它不足以成为安全功能。