我正在使用 wget (1.21.1) 镜像站点 - 几乎一切正常,但某些 URL 内容已编码,这会导致问题。我正在运行这个命令:
wget -mkEpnp --adjust-extension --no-clobber https://example.com
但是一些 HTML(仅内联样式,据我所见)包含编码字符串,例如:
<div style="background-image:url('https://resource.com/image.jpg');">
浏览器正确解释该行并显示背景图像,但 wget 并未解码 '
,而是检索 https://example.com/&
,然后在 HTML 中引用 &.html
。在不改变源代码的情况下,有没有办法解码 HTML 以便 wget 正常工作?