Question

我正在编写一个bash脚本并使用wget从网站中检索一些PDF文件。例如：

wget www.barb.co.uk/news/item-subscriber/id/213/index.html

但是wget将文件保存为index.html。如果我在浏览器中并输入该URL，则会正确下载该文件的真实姓名 - “BARB Bulletin 25 - December 10.pdf”。

我怎样才能让wget做同样的事情？或者是否有另一种方法可以找到文件的真实名称（来自bash脚本）？

Answer 1

您可以使用--content-disposition选项使wget对HTTP响应的标题进行更复杂的查看，这在大多数情况下都有帮助。

示例：

wget --content-disposition www.barb.co.uk/news/item-subscriber/id/213/index.html

Answer 2

看看wgets --content-disposition选项。