Question

我有以下wget命令：

wget --http-user='user' --http-password='password' --trust-server-names --quiet -r -p -k -E -e robots=off -P /Users/Sebastian/Desktop/test/ http://somedomain.com

这除了以下内容外，我还想做它。它重写了我的规范链接：

<link rel="canonical" href="http://somedomain.com/somedir/somedir/somedir/folder/" />

到此：

<link rel="canonical" href="index.html" />

知道我怎么能在重写过程中留下规范链接？

Answer 1

我们是否可以检测该URL是否仅从该给定的URL标记为cannonical？因为一个解决方案就是不下载这些页面。

另一种解决方案 - 只需下载所有内容。比删除那些标准文件并重写here所述。

wget条件链接重写

1 个答案: