我正在使用下面的代码段将HTTP响应下载到本地文件。 有时,我在url中的内容是多语言的(中文,日文,泰文数据等)。 我使用ContentEncoding标头指定我的内容是UTF-8编码,但这对我的本地输出文件没有影响,该文件是用ASCII生成的。因此,多语言数据已损坏。有什么帮助吗?
using (var webClient = new WebClient())
{
webClient.Credentials = CredentialCache.DefaultCredentials;
webClient.Headers.Add(HttpRequestHeader.UserAgent, "Mozilla/4.0");
webClient.Headers.Add(HttpRequestHeader.ContentEncoding, "utf-8");
webClient.DownloadFile(url, @"c:\temp\tempfile.htm");
}
答案 0 :(得分:6)
ContentEncoding
标头不用于指定字符集。客户端使用它来说明它支持哪种编码(压缩)。
客户端无法告诉服务器要发送的字符集。服务器发送其数据和一些标题字段,说明正在使用的字符集。通常它位于ContentType
标题中,如下所示:text/html; charset=UTF-8
。
当您使用WebClient
时,您希望将Encoding
属性设置为后备,以便在服务器无法识别字符集时使用您的默认值。例如:
WebClient client = new WebClient();
client.Encoding = Encoding.UTF8;
string s = client.DownloadString(DownloadUrl);
有关详细信息,请参阅http://www.informit.com/guides/content.aspx?g=dotnet&seqNum=800。