我有以下wget命令:
wget --http-user='user' --http-password='password' --trust-server-names --quiet -r -p -k -E -e robots=off -P /Users/Sebastian/Desktop/test/ http://somedomain.com
这除了以下内容外,我还想做它。它重写了我的规范链接:
<link rel="canonical" href="http://somedomain.com/somedir/somedir/somedir/folder/" />
到此:
<link rel="canonical" href="index.html" />
知道我怎么能在重写过程中留下规范链接?
答案 0 :(得分:0)
我们是否可以检测该URL是否仅从该给定的URL标记为cannonical? 因为一个解决方案就是不下载这些页面。
另一种解决方案 - 只需下载所有内容。比删除那些标准文件并重写here所述。