更新:我将wget从1.10升级到1.12并解决了问题。
例如
www.example.com/level1/level2 /../的test.html
通过这种方式,wget和浏览器将访问
www.example.com/level1/test.html
但是
www.example.com /../的test.html
wget将访问
www.example.com /../的test.html
浏览器将访问
www.example.com/test.html
我使用wget解析一些网页以获取它的大小及其中的元素。 现在我发现有些网页使用“../css/xxx.jpg”而不是“css / xxx.jpg”。 可以通过浏览器访问网页,但不是wget。
有办法解决吗?谢谢。
答案 0 :(得分:0)
在将URL传递给wget之前,请从路径的请求中修剪“../”。 (将URL分成组件会有所帮助。)
如何执行此操作取决于您使用的语言或框架。