带有ß字符的字符串的UrlEncoding问题

时间:2012-05-01 23:15:28

标签: c# encoding urlencode

我有一个参数,我必须将其作为网址的一部分传递。该参数包含以下字符:ß

当我对这个字符串进行编码时,我期待这个:%DF 但相反,我得到:%c3%9f

这是我用来测试的一行C#

  string test = HttpUtility.UrlEncode("ß");

2 个答案:

答案 0 :(得分:6)

这是因为UrlEncode的默认实现基于UTF8字符编码。实际上,这完全在你的掌控之中。

例如,以下代码:

string sample = new string((char)0x0DF, 1);
string test = HttpUtility.UrlEncode(sample);
Console.WriteLine("UTF8 Ecoded: {0}", test);
test = HttpUtility.UrlEncode(sample, Encoding.GetEncoding(1252));
Console.WriteLine("1252 Ecoded: {0}", test);

输出以下内容:

UTF8 Ecoded: %c3%9f
1252 Ecoded: %df

当然,在URI上使用其他编码的危险在于某些字符根本无法表示......

例如,这段代码:

string sample = new string((char) 312, 1);
Encoding encoding = Encoding.GetEncoding(1252);
string test = HttpUtility.UrlEncode(sample);
Console.WriteLine("UTF8 Ecoded: {0}, round-trip = {1}", test, sample == HttpUtility.UrlDecode(test));
test = HttpUtility.UrlEncode(sample, encoding);
Console.WriteLine("1252 Ecoded: {0}, round-trip = {1}", test, sample == HttpUtility.UrlDecode(test, encoding));
Console.ReadLine();

将输出以下内容:

UTF8 Ecoded: %c4%b8, round-trip = True
1252 Ecoded: %3f, round-trip = False

您可以在后面的示例中看到编码为“%3f”,当未编码时等于问号“?”,而不是输入字符312(0x138)。

简而言之,将“ß”编码为“%c3%9f”并没有错,相反,它是正确的表示。但是,如果您必须使用编码“%DF以便远程服务器正确解码它,那么请使用1252代码页,如图所示。

答案 1 :(得分:4)

使用UTF-8编码时,ß字符编码为%c3%9f。如果可能的话,这就是你应该使用的。

如果您的目标网络服务器使用其他一些编码,则需要确切知道该编码是什么。由于您希望将该字符编码为%df,可能是Windows-1252Windows-1250(或可能是其他人)。

如果您确定这是您想要做的,您可以使用(假设Windows-1252):

HttpUtility.UrlEncode("ß", Encoding.GetEncoding(1252))