wget mirror 可以跟踪编码的 URL 吗?

时间:2021-07-30 17:37:07

标签: wget

我正在使用 wget (1.21.1) 镜像站点 - 几乎一切正常,但某些 URL 内容已编码,这会导致问题。我正在运行这个命令:

wget -mkEpnp --adjust-extension --no-clobber https://example.com

但是一些 HTML(仅内联样式,据我所见)包含编码字符串,例如:

<div style="background-image:url(&#39;https://resource.com/image.jpg&#39;);">

浏览器正确解释该行并显示背景图像,但 wget 并未解码 &#39;,而是检索 https://example.com/&,然后在 HTML 中引用 &.html。在不改变源代码的情况下,有没有办法解码 HTML 以便 wget 正常工作?

0 个答案:

没有答案
相关问题