转换“& aring;” “& ouml;”正常的代表

时间:2011-07-31 20:30:05

标签: c# character-encoding html-agility-pack iso-8859-1

我正在加载网页System.Net.WebClient。页面采用ISO-8859-1编码。 如果我将其写入文件然后打开,我可以正常看到所有字符。

但是,如果我将此内容放入HtmlAgilityPack然后提取innerText属性, 我收到一些特殊字母,编号为åö

如何将它们转换为正常表示?

2 个答案:

答案 0 :(得分:5)

使用HttpUtility.HtmlDecode方法

HttpUtility.HtmlDecode("å"); // å

答案 1 :(得分:0)

您可以使用文本字符串作为参数调用HtmlEntity.DeEntitize方法。