我有一个看起来非常简单的小问题...但我只是不明白! 我尝试下载网站内容:{{3}}(如果您尝试通过www.cspsp.gshi.org访问它,则会出现错误的页面....)
为此,我在Powershell中这样做:
(New-Object System.Net.WebClient).DownloadFile( 'http://cspsp.gshi.org/', 'save.htm' )
我可以使用Firefox访问网站并轻松下载其内容,但Powershell始终输出类似的内容:
The remoteserver returned an Error: (404) Nothing found.
(翻译自德语)
我不确定我在这里做错了什么。像谷歌这样的其他网站也能正常运作。
感谢您的帮助!
答案 0 :(得分:2)
该网站似乎依赖于HTTP客户端发送的User-Agent
请求标头,并且System.Net.WebClient
甚至没有发送默认值(至少,当我点击时它没有发送我自己的本地服务器。)
无论哪种方式,这对我有用:
$request = (New-Object System.Net.WebClient)
$request.headers['User-Agent'] = "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.40 Safari/537.17"
$request.DownloadFile('http://cspsp.gshi.org/', 'saved.html')
希望这会有所帮助。 :d