HTTrack在带有德语特殊字符的unicode网址上提供404

时间:2017-08-04 13:50:16

标签: url unicode httrack

我已经意识到如果网址中包含特殊字符,HTTrack无法下载文件,例如德语ß - 它会返回404响应。

屏幕截图上的错误如下:

image

HTTrack中是否有任何设置可以处理这些字符?

ps:我找到了一个类似的帖子,但没有答案:

Httrack faulty when encountering japanese encoded URLS

1 个答案:

答案 0 :(得分:0)

HTTrack似乎能够从具有特殊字符的网址中获取文件错误,只有当您没有运行"真正的"域抓取,但是:

  • 首先创建一个网址列表,
  • 将其另存为iso-8859-1
  • 让HTTrack抓取此列表

如果HTTrack会自行探索网址,则会在包含特殊字符的网址上遇到404错误 - 至少我无法让它们无错误。也许有人会提供一个神奇的设置;)