我想从网页源找到绝对的链接路径 例如,在网页源中,有一行如下:
href="lectures/lecture04.pdf"
但是这个的绝对路径是
www.abc.com/courses/cs101/lectures/lecture04.pdf
有没有办法在bash shell中获取此路径?
答案 0 :(得分:4)
尝试:
$ wget --convert-links URL
从wget
manual,交换机--convert-links
描述如下:
Wget尚未下载的文件链接将更改为包含主机名和所指位置的绝对路径。
示例:如果下载的文件/foo/doc.html链接到/bar/img.gif(或发送到../bar/img.gif),则doc.html中的链接将被修改为指向{ {1}}。