我想知道如何阅读其他网站的文件结构。
例如,如果网站是:www.test.com,我想检索他们在服务器上有多少文件,哪些是html,哪些是css。我不想编辑它们或只计算任何东西。
例如: 根文件夹> index.html,about.html(2个html文件) 根文件夹>脚本> main.js(1 javascript)
文件夹名称可能会有所不同,因此应搜索整个结构。
我试过谷歌,但我得到了想要访问我不想要的实际文件内容的结果。
我正在使用javascript。
答案 0 :(得分:1)
这无法完成。
除非有人链接到某个服务器,否则您不知道其他服务器上存在某个文件。我的网站上有一张长颈鹿的照片,但除非我告诉你它在哪里,否则你无法找到它(或算上它)。
也就是说,如果您使用的是Node.js,您可以使用类似crawler库的内容访问网站的每个公共页面并打开每个链接,然后计算您看到的文件数量。