我正在编写一个bash脚本并使用wget从网站中检索一些PDF文件。例如:
wget www.barb.co.uk/news/item-subscriber/id/213/index.html
但是wget将文件保存为index.html。如果我在浏览器中并输入该URL,则会正确下载该文件的真实姓名 - “BARB Bulletin 25 - December 10.pdf”。
我怎样才能让wget做同样的事情?或者是否有另一种方法可以找到文件的真实名称(来自bash脚本)?
答案 0 :(得分:13)
您可以使用--content-disposition选项使wget对HTTP响应的标题进行更复杂的查看,这在大多数情况下都有帮助。
示例:
wget --content-disposition www.barb.co.uk/news/item-subscriber/id/213/index.html
答案 1 :(得分:3)
看看wgets --content-disposition
选项。