从HTTPS站点下载数据时出现异常

时间:2011-02-01 06:59:25

标签: c# https httpwebrequest webclient

我正在使用siteripper / screenscraper查找皇家邮政网站上的跟踪信息。不幸的是,皇家邮政不支持API,所以这是实现它的方法。

无论我做什么,我都会得到同样的例外。 (远程服务器返回错误:(500)内部服务器错误。

我的基本代码是:

class Program
{
    static void Main(string[] args)
    {
        string url = "http://track.royalmail.com/portal/rm/track?catId=22700601&gear=authentication&forcesegment=SG-Personal";
        byte[] response;

        WebClient webClient = new WebClient();
        response = webClient.DownloadData(url);
    }
}

我使用了Fiddler来调查我的浏览器进行的数据交易,以便在我的代码中模仿它。我可以看到皇家邮政使用cookies,所以我尝试通过添加cookie处理程序来实现支持cookie的WebClient:

public class CookieAwareWebClient : WebClient
{
    private CookieContainer m_container = new CookieContainer();

    protected override WebRequest GetWebRequest(Uri address)
    {
        WebRequest request = base.GetWebRequest(address);
        if (request is HttpWebRequest)
        {
            (request as HttpWebRequest).CookieContainer = m_container;
        }
        return request;
    }
}

但这并没有帮助: - (

我还尝试通过Royal Mails SSL保护站点(https://www.royalmail.com/portal/sme/track?catId=62200738&mediaId=63900708)查找跟踪信息,并在我的C#程序中实现凭据,但没有运气。

我现在已经碰壁了,我不断碰到那些似乎对我没有任何帮助的教程/线程。

我希望那里有一个聪明的大脑: - )

1 个答案:

答案 0 :(得分:3)

如果您发送所有标题,则应停止获取500错误

string url = "http://track.royalmail.com/portal/rm/trackresults?catId=22700601&pageId=trt_rmresultspage&keyname=track_blank&_requestid=17931"; 
using(WebClient webClient = new WebClient()) {
    webClient.Headers["User-Agent"] = "Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US; rv:1.9.2.6) Gecko/20100625 Firefox/3.6.6 (.NET CLR 3.5.30729)";
    webClient.Headers["Accept"] = "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8";
    webClient.Headers["Accept-Language"] = "en-us,en;q=0.5";
    webClient.Headers["Accept-Encoding"] = "    gzip,deflate";
    webClient.Headers["Accept-Charset"] = "ISO-8859-1,utf-8;q=0.7,*;q=0.7";
    byte[] response = webClient.DownloadData(url); 
}