我正在尝试使用WebClient
查询某个网址。
我有一个集合,我循环访问以获取QueryString
值,并构建最终的URL,然后将其传递给客户端。
第一次执行得很好,我得到了适当的响应,然而,当它第二次进入循环时,我得到了错误:
System.Net.WebException - >远程服务器返回错误:(403)禁止。
如果我第一次得到回复。然后我也应该收集其余的收藏品。
有什么线索的原因?我可能会缺少什么?
以下是我正在使用的代码段。
using(System.IO.StreamWriter file = new System.IO.StreamWriter(@"C:\sample.text")) {
foreach(var f in fileCollections) {
strFinalURL = string.Empty;
strFinalURL = "someURL" + f; // f can be considered as querystring param value
try {
using(var client = new WebClient()) {
test = client.DownloadString(strFinalURL);
if (!test.Contains("somecondition")) {
file.WriteLine("");
}
}
} catch (System.Exception ex) {
Console.WriteLine(ex.Message);
}
}
}
答案 0 :(得分:15)
某些Web服务器可以根据它们提供的用户代理字符串来阻止请求。在您的情况下,您将空字符串作为用户代理发送。尝试添加浏览器的用户代理,任何浏览器都可以。
例如:
client.Headers.Add("user-agent", " Mozilla/5.0 (Windows NT 6.1; WOW64; rv:25.0) Gecko/20100101 Firefox/25.0");
有关用户代理的列表,您可以点击here。
答案 1 :(得分:1)
如果你说的一切都是正确的,那么我怀疑服务器节流正在发挥作用。尝试在循环中添加Thread.Sleep
以减慢速度。