我正在加载网页System.Net.WebClient
。页面采用ISO-8859-1
编码。
如果我将其写入文件然后打开,我可以正常看到所有字符。
但是,如果我将此内容放入HtmlAgilityPack然后提取innerText属性,
我收到一些特殊字母,编号为å
和ö
。
如何将它们转换为正常表示?
答案 0 :(得分:5)
HttpUtility.HtmlDecode("å"); // å
答案 1 :(得分:0)
您可以使用文本字符串作为参数调用HtmlEntity.DeEntitize
方法。