Question

我正在使用 wget (1.21.1) 镜像站点 - 几乎一切正常，但某些 URL 内容已编码，这会导致问题。我正在运行这个命令：

wget -mkEpnp --adjust-extension --no-clobber https://example.com

但是一些 HTML（仅内联样式，据我所见）包含编码字符串，例如：

<div style="background-image:url(&#39;https://resource.com/image.jpg&#39;);">

浏览器正确解释该行并显示背景图像，但 wget 并未解码 '，而是检索 https://example.com/&，然后在 HTML 中引用 &.html。在不改变源代码的情况下，有没有办法解码 HTML 以便 wget 正常工作？