如何获取/读取其他网站文件结构

时间:2014-06-25 10:39:12

标签: javascript

我想知道如何阅读其他网站的文件结构。

例如,如果网站是:www.test.com,我想检索他们在服务器上有多少文件,哪些是html,哪些是css。我不想编辑它们或只计算任何东西。

例如: 根文件夹> index.html,about.html(2个html文件) 根文件夹>脚本> main.js(1 javascript)

文件夹名称可能会有所不同,因此应搜索整个结构。

我试过谷歌,但我得到了想要访问我不想要的实际文件内容的结果。

我正在使用javascript。

1 个答案:

答案 0 :(得分:1)

这无法完成。

除非有人链接到某个服务器,否则您不知道其他服务器上存在某个文件。我的网站上有一张长颈鹿的照片,但除非我告诉你它在哪里,否则你无法找到它(或算上它)。

也就是说,如果您使用的是Node.js,您可以使用类似crawler库的内容访问网站的每个公共页面并打开每个链接,然后计算您看到的文件数量。