从网页递归下载文件

时间:2010-10-17 15:27:29

标签: python regex scripting recursion

http://examples.oreilly.com/9780735615366/

我实际上希望能够将所有这些文件放在我的磁盘中。

你可以看到有很多文件夹,每个文件夹都有不同类型的文件。

并且您无法直接下载“the-folder”...仅限个别文件

有没有办法自动化过程..?

我需要在网址上使用正则表达式将它们排列在类似层次结构的“文件夹”中。

我使用什么......像python这样的脚本语言?

4 个答案:

答案 0 :(得分:4)

查看wget工具。它可以完全按照你想要的那样做。

答案 1 :(得分:1)

wget(GNU命令行工具)将为您完成此操作。 您想要做的文档在这里: http://www.gnu.org/software/wget/manual/html_node/Recursive-Retrieval-Options.html

答案 2 :(得分:0)

尝试Wget。它是一个简单的命令行工具,能够做到这一点。

答案 3 :(得分:0)

作弊的答案是使用FTP:

ftp://examples.oreilly.com/pub/examples/9780735615366/

是你给出的例子......