Javascript从网页的文件夹下载内容

时间:2012-01-11 11:59:02

标签: javascript download web-crawler userscripts

我可以访问我网站的公共文件夹。它上面有多少个文件。说URL是

http://www.abc.com/step-b/Prints/

以上网址在浏览器中显示时显示:

**Index of /step-b/Prints

    Name    Last modified   Size    Description
    Parent Directory         -
    L/  05-Jan-2006 23:59    -
    L2/ 05-Jan-2006 23:51    -
    R/  05-Jan-2006 23:41    -
    R2/ 05-Jan-2006 23:32    -
    Thumbs.db   30-Jan-2007 09:00    81K
    hpothb07.dat    27-Aug-2008 07:00    0
    hpothb07.tif    27-Aug-2008 07:00    0**

现在我希望运行一个循环来进入每个文件夹L,L2,R,R2,并从中提取大约200个文件。

我没有任何线索如何开始。如果连JS都是最好的事情。

任何人都可以指导我或建议我..我不希望代码,但指导如何做的事情。

1 个答案:

答案 0 :(得分:0)

由于相同的原始策略,在JS中执行您想要的操作可能有点困难(例如,您无法通过AJAX下载此页面)。

但如果您已经知道如何访问该页面,那么您必须解析它。您在浏览器中看到的显然是HTML代码。因此,您需要知道如何检索这些文件夹名称。如果HTML基于表格,那么这应该不难。

最后,当您解析页面并且您有文件夹名称时,您需要知道它们内部的内容。可能以下网址http://www.abc.com/step-b/Prints/L2/会告诉您L2内的内容。如果它不会那么你现在可以停止,因为它不可能做到。 :)除非你现在以某种方式如何通过http检索文件夹中的文件列表。

循环中的下一步,您将浏览所有文件夹并像以前一样解析它们。然后将文件名追加到http://www.abc.com/step-b/Prints/L2/myfile.txt之类的网址末尾(它可能无法正常工作 - 请参阅之前的评论)。此时您可以轻松下载它们。

请记住,这都是理论,它取决于Web服务器如何响应请求。我可以向你保证,你想要完成的任务根本不容易。