如何使用wget从网址末尾的特定字符串下载网页?

时间:2013-12-17 09:16:59

标签: wget

我希望下载一个网站供离线观看。所以我不需要图像。我只需要该页面中的内容。 wget做的事情。当我使用-r作为参数时,wget会直接从网站下载所有数据。 我只想下载所有链接的内容,这些链接以我正在下载的网站的网址末尾的“x”或“p”等字母结尾

提前致谢。

2 个答案:

答案 0 :(得分:0)

尝试:

wget -A '*[xp]' ...

来自Types of Files

  

' - accept'选项的参数是Wget将在递归检索期间下载的文件后缀或模式的列表。后缀是文件的结尾部分,由“普通”字母组成,例如'gif'或'.jpg'。匹配模式包含类似shell的通配符,例如'books *'或'zelazny * 196 [0-9] *'。

     

因此,指定'wget -A gif,jpg'将使Wget仅下载以'gif'或'jpg'结尾的文件,即gifs和jpegs。另一方面,'wget -A“zelazny * 196 [0-9] *”'将仅下载以'zelazny'开头并包含1960年至1969年间任何地方的数字的文件。查看shell的手册,了解模式匹配的工作原理。

答案 1 :(得分:0)

wget -O yourfile.zip http://www.site.com/?id=34ee

wget -O customFileName http://www.x.com/y/z
mv id=34ee yourfile.zip