wget在镜像网站并插入绝对链接时双重转换一个文件

时间:2015-11-19 15:38:10

标签: powershell wget

My issue is similar to this SO question,但我有更多详情(而且没有任何答案)。

我在Powershell脚本中运行以下命令行以在本地镜像共享点站点:

CMD.EXE /C ".\wget.exe --mirror --convert-links --adjust-extension --page-requisites --no-parent --no-cookies --ignore-case http://server.domain.com/foo/wiki/Home.aspx"

几乎所有页面都已正确下载和转换。其中一个(我发现)不是;即使同一目录中的文件被正确转换(因此它不是路径长度问题),该单个文件中的链接将转换为绝对URL(即“http://server.domain.com/foo/site.css”而不是“../site.css”) )。

我在日志中注意到以下内容:

Converting server.domain.com/foo/wiki/bar.aspx.html... 54-34

然后在日志中:

Converting server.domain.com/foo/wiki/bar.aspx.html... 21-33

因此,由于某种原因,它正在处理文件两次。第一次,链接得到正确修复,然后第二次更改为在线链接。

在转换之前,错误文件中的链接如下所示:

<link rel="stylesheet" type="text/css" href="/_layouts/1033/styles/Themable/search.css?rev=T%2Bhraxktc1A8EnaG5gGMHQ%3D%3D"/>
<link rel="stylesheet" type="text/css" href="/_layouts/1033/styles/Themable/wiki.css?rev=pOVpruQJauHtoX04fhoGSA%3D%3D"/>
<link rel="stylesheet" type="text/css" href="/_layouts/1033/styles/Themable/corev4.css?rev=p63%2BuzTeSJc22nVGNZ5zwg%3D%3D"/>

他们看起来像这样:

<link rel="stylesheet" type="text/css" href="http://server.domain.com/_layouts/1033/styles/Themable/search.css@rev=T+hraxktc1A8EnaG5gGMHQ==.css"/>
<link rel="stylesheet" type="text/css" href="http://server.domain.com/_layouts/1033/styles/Themable/wiki.css@rev=pOVpruQJauHtoX04fhoGSA==.css"/>
<link rel="stylesheet" type="text/css" href="http://server.domain.com/_layouts/1033/styles/Themable/corev4.css@rev=p63+uzTeSJc22nVGNZ5zwg==.css"/>

在转换之前,其中一个正确文件中的链接如下所示:

<link rel="stylesheet" type="text/css" href="/_layouts/1033/styles/Themable/search.css?rev=T%2Bhraxktc1A8EnaG5gGMHQ%3D%3D"/>
<link rel="stylesheet" type="text/css" href="/_layouts/1033/styles/Themable/wiki.css?rev=pOVpruQJauHtoX04fhoGSA%3D%3D"/>
<link rel="stylesheet" type="text/css" href="/_layouts/1033/styles/Themable/corev4.css?rev=p63%2BuzTeSJc22nVGNZ5zwg%3D%3D"/>

他们看起来像这样:

<link rel="stylesheet" type="text/css" href="../../../_layouts/1033/styles/Themable/search.css@rev=T+hraxktc1A8EnaG5gGMHQ==.css"/>
<link rel="stylesheet" type="text/css" href="../../../_layouts/1033/styles/Themable/wiki.css@rev=pOVpruQJauHtoX04fhoGSA==.css"/>
<link rel="stylesheet" type="text/css" href="../../../_layouts/1033/styles/Themable/corev4.css@rev=p63+uzTeSJc22nVGNZ5zwg==.css"/>

该网站不是非常大(约92kb未压缩)。

为什么差异,我能做些什么让wget在这里表现出来?

0 个答案:

没有答案