我正在尝试使用WebClient类来查看希伯来语页面的内容,但是得到的是胡言乱语而不是希伯来语。
我的代码是:
using (WebClient webClient = new WebClient())
{
webClient.Headers.Add(HttpRequestHeader.ContentType, "charset=windows-1255");
string page = webClient.DownloadString("http://hebrew-academy.huji.ac.il/Pages/default.aspx");
}
我正确地收到了英文内容,但希伯来语的内容例如是:
<标题> ''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''和'/ title&gt ;
有谁知道如何正确获取希伯来语内容?
答案 0 :(得分:4)
该页面以UTF-8格式传输,因此您应该将其解释为UTF-8,而不是Windows-1255。 Do this by setting WebClient.Encoding
to System.Text.Encoding.UTF8
.