我使用WebUtilty.HtmlDecode
来解码HTML。事实证明它没有正确解码,例如,–
应该解码为“ - ”字符,但WebUtilty.HtmlDecode
不解码它。但是,HttpUtilty.HtmlDecode
确实如此。
Debug.WriteLine(WebUtility.HtmlDecode("–"));
Debug.WriteLine(HttpUtility.HtmlDecode("–"));
> –
> –
这两个文件是相同的: 将用于HTTP传输的HTML编码的字符串转换为已解码的字符串。
为什么它们不同,我应该使用哪一个,如果我切换到WebUtility.HtmlDecode以使“ - ”正确解码会发生什么变化?
答案 0 :(得分:11)
这两种方法的实现在Windows Phone上确实有所不同。
<强> WebUtility.HtmlDecode:强>
public static void HtmlDecode(string value, TextWriter output)
{
if (value != null)
{
if (output == null)
{
throw new ArgumentNullException("output");
}
if (!StringRequiresHtmlDecoding(value))
{
output.Write(value);
}
else
{
int length = value.Length;
for (int i = 0; i < length; i++)
{
bool flag;
uint num4;
char ch = value[i];
if (ch != '&')
{
goto Label_01B6;
}
int num3 = value.IndexOfAny(_htmlEntityEndingChars, i + 1);
if ((num3 <= 0) || (value[num3] != ';'))
{
goto Label_01B6;
}
string entity = value.Substring(i + 1, (num3 - i) - 1);
if ((entity.Length <= 1) || (entity[0] != '#'))
{
goto Label_0188;
}
if ((entity[1] == 'x') || (entity[1] == 'X'))
{
flag = uint.TryParse(entity.Substring(2), NumberStyles.AllowHexSpecifier, NumberFormatInfo.InvariantInfo, out num4);
}
else
{
flag = uint.TryParse(entity.Substring(1), NumberStyles.Integer, NumberFormatInfo.InvariantInfo, out num4);
}
if (flag)
{
switch (_htmlDecodeConformance)
{
case UnicodeDecodingConformance.Strict:
flag = (num4 < 0xd800) || ((0xdfff < num4) && (num4 <= 0x10ffff));
goto Label_0151;
case UnicodeDecodingConformance.Compat:
flag = (0 < num4) && (num4 <= 0xffff);
goto Label_0151;
case UnicodeDecodingConformance.Loose:
flag = num4 <= 0x10ffff;
goto Label_0151;
}
flag = false;
}
Label_0151:
if (!flag)
{
goto Label_01B6;
}
if (num4 <= 0xffff)
{
output.Write((char) num4);
}
else
{
char ch2;
char ch3;
ConvertSmpToUtf16(num4, out ch2, out ch3);
output.Write(ch2);
output.Write(ch3);
}
i = num3;
goto Label_01BD;
Label_0188:
i = num3;
char ch4 = HtmlEntities.Lookup(entity);
if (ch4 != '\0')
{
ch = ch4;
}
else
{
output.Write('&');
output.Write(entity);
output.Write(';');
goto Label_01BD;
}
Label_01B6:
output.Write(ch);
Label_01BD:;
}
}
}
}
<强> HttpUtility.HtmlDecode:强>
public static string HtmlDecode(string html)
{
if (html == null)
{
return null;
}
if (html.IndexOf('&') < 0)
{
return html;
}
StringBuilder sb = new StringBuilder();
StringWriter writer = new StringWriter(sb, CultureInfo.InvariantCulture);
int length = html.Length;
for (int i = 0; i < length; i++)
{
char ch = html[i];
if (ch == '&')
{
int num3 = html.IndexOfAny(s_entityEndingChars, i + 1);
if ((num3 > 0) && (html[num3] == ';'))
{
string entity = html.Substring(i + 1, (num3 - i) - 1);
if ((entity.Length > 1) && (entity[0] == '#'))
{
try
{
if ((entity[1] == 'x') || (entity[1] == 'X'))
{
ch = (char) int.Parse(entity.Substring(2), NumberStyles.AllowHexSpecifier, CultureInfo.InvariantCulture);
}
else
{
ch = (char) int.Parse(entity.Substring(1), CultureInfo.InvariantCulture);
}
i = num3;
}
catch (FormatException)
{
i++;
}
catch (ArgumentException)
{
i++;
}
}
else
{
i = num3;
char ch2 = HtmlEntities.Lookup(entity);
if (ch2 != '\0')
{
ch = ch2;
}
else
{
writer.Write('&');
writer.Write(entity);
writer.Write(';');
continue;
}
}
}
}
writer.Write(ch);
}
return sb.ToString();
}
有趣的是,WP7上不存在WebUtility。此外,WebUtility的WP8实现与桌面实现相同。 HttpUtility.HtmlDecode
的桌面实现只是WebUtility.HtmlDecode
的包装。最后但同样重要的是,Silverlight 5具有与Windows Phone相同的HttpUtility.HtmlDecode
实现,并且不实现WebUtility。
从那里,我可以猜测:由于Windows Phone 7运行时基于Silverlight,WP7继承了Silverlight版本的HttpUtility.HtmlDecode
,并且WebUtility不存在。然后是WP8,其运行时基于WinRT。 WinRT带来了WebUtility,并保留了旧版HttpUtility.HtmlDecode
以确保与旧版WP7应用程序的兼容性。
要知道你应该使用哪一个......如果你想要定位WP7,那么你别无选择,只能使用HttpUtility.HtmlDecode
。如果您的目标是WP8,那么只需选择最适合您需求的方法。 WebUtility可能是面向未来的选择,以防微软决定在即将推出的Windows Phone版本中放弃Silverlight运行时。但我只是选择HttpUtility的实际选择,而不必担心手动支持你提出的问题。
答案 1 :(得分:4)
方法完全相同。此外,如果您尝试对它们进行反编译,那么实现看起来就像是从另一个实现复制了。
区别仅在于预期用途。 HttpUtility
包含在System.Web
程序集中,并且应该在通过此程序集构建的ASP.net应用程序中使用。 WebUtility
包含在几乎所有应用程序引用的System
程序集中,用于更多通用或客户端使用。
答案 2 :(得分:2)
只是为了通知在搜索中找到此内容的其他人。使用问题中提到的任何函数,但绝不使用Windows.Data.Html.HtmlUtilities.ConvertToText(string input)
。它比WebUtilty.HtmlDecode
慢70倍并产生崩溃!崩溃将在DevCenter中命名为mshtml!IEPeekMessage
。看起来这个函数调用InternetExplorer来转换字符串。只是避免它。