wget条件链接重写

时间:2013-03-26 17:43:55

标签: rewrite hyperlink wget

我有以下wget命令:

wget --http-user='user' --http-password='password' --trust-server-names --quiet -r -p -k -E -e robots=off -P /Users/Sebastian/Desktop/test/ http://somedomain.com

这除了以下内容外,我还想做它。它重写了我的规范链接:

<link rel="canonical" href="http://somedomain.com/somedir/somedir/somedir/folder/" />

到此:

<link rel="canonical" href="index.html" />

知道我怎么能在重写过程中留下规范链接?

1 个答案:

答案 0 :(得分:0)

我们是否可以检测该URL是否仅从该给定的URL标记为cannonical? 因为一个解决方案就是不下载这些页面。

另一种解决方案 - 只需下载所有内容。比删除那些标准文件并重写here所述。