wget“镜像”pdf链接到不同的域

时间:2011-09-21 13:17:31

标签: javascript regex url download wget

Webpage包含link to a pdf(请注意不同的域名)。

我可以使用wget直接下载pdf,但似乎无法识别正确的wget命令行选项来“镜像”包含此链接的pdf的网页。我尝试使用像

这样的选项组合
  • -p
  • - 跨度的主机
  • -D
  • - 接受

没有成功。

是否可以使用wget(或其他一些命令行工具)下载链接的pdf-s?

感谢

2 个答案:

答案 0 :(得分:1)

尝试解析http://www.yowconference.com.au/brisbane/data/35.js。 (我在HttpFox中找到了这个url。)格式化代码后(例如使用http://jsbeautifier.org/),可以很容易地找到pdf文件的URL。

答案 1 :(得分:0)

虽然pdf链接显示在浏览器中,但页面源不包含下载链接。因此,wget无法查看/关注该链接,因为它并未真正“处理”该页面。