wget访问url,其主目录正好在主机名之后

时间:2011-09-08 08:15:41

标签: wget

更新:我将wget从1.10升级到1.12并解决了问题。

例如

  

www.example.com/level1/level2 /../的test.html

通过这种方式,wget和浏览器将访问

  

www.example.com/level1/test.html

但是

  

www.example.com /../的test.html

wget将访问

  

www.example.com /../的test.html

浏览器将访问

  

www.example.com/test.html

我使用wget解析一些网页以获取它的大小及其中的元素。 现在我发现有些网页使用“../css/xxx.jpg”而不是“css / xxx.jpg”。 可以通过浏览器访问网页,但不是wget。

有办法解决吗?谢谢。

1 个答案:

答案 0 :(得分:0)

在将URL传递给wget之前,请从路径的请求中修剪“../”。 (将URL分成组件会有所帮助。)

如何执行此操作取决于您使用的语言或框架。