假设我有一个可通过http e,g
访问的目录 Http://www.abc.com/pdf/books
在文件夹里面我有很多pdf文件
我可以使用
之类的东西答案 0 :(得分:3)
wget -r -l1 -A.pdf http://www.abc.com/pdf/books
答案 1 :(得分:2)
来自wget手册页:
Wget can follow links in HTML and XHTML pages and create local versions of remote web sites, fully recreating the directory structure of the original site. This is sometimes referred to as ``recursive downloading.'' While doing that, Wget respects the Robot Exclusion Standard (/robots.txt). Wget can be instructed to convert the links in downloaded HTML files to the local files for offline viewing.
和
Recursive Retrieval Options
-r
--recursive
Turn on recursive retrieving.
-l depth
--level=depth
Specify recursion maximum depth level depth. The default maximum depth is 5.
答案 2 :(得分:0)
这取决于Web服务器和服务器的配置。严格来说,URL不是目录路径,因此http://something/books/*
毫无意义。
但是,如果Web服务器将http://something/books
的路径实现为列出网站上所有书籍的索引页面,那么您可以使用recursive option和蜘蛛选项,wget会很高兴按照http://something/books
索引页面中的任何链接。