从网页源获取链接的绝对路径

时间:2012-12-27 14:11:38

标签: bash shell wget

我想从网页源找到绝对的链接路径 例如,在网页源中,有一行如下:

href="lectures/lecture04.pdf" 

但是这个的绝对路径是

www.abc.com/courses/cs101/lectures/lecture04.pdf   

有没有办法在bash shell中获取此路径?

1 个答案:

答案 0 :(得分:4)

尝试:

$ wget --convert-links URL

wget manual,交换机--convert-links描述如下:

  

Wget尚未下载的文件链接将更改为包含主机名和所指位置的绝对路径。

     

示例:如果下载的文件/foo/doc.html链接到/bar/img.gif(或发送到../bar/img.gif),则doc.html中的链接将被修改为指向{ {1}}。