使用HTMLAgilityPack加载HTML字符串

时间:2013-02-19 15:58:33

标签: c# html-agility-pack

我正在将以字符串形式传递的HTML加载到HTMLAgilityPack文档中,如下所示。

 HtmlDocument html = new HtmlDocument();
 html.OptionOutputAsXml = true;
 html.LoadHtml(htmlText);
 HtmlNode document = html.DocumentNode;

加载文档后.InnerHtml显示所有引号的& quot(下面的示例)。如何避免这种情况?

<span style=\"\\&quot;MARGIN-LEFT:\" class=\"\\&quot;form_title\\&quot;\" _20px5c_22_=\"\">MyText</span>

我希望样本显示如下。

<span class=\"form_title\" style=\"MARGIN-LEFT: 20px\">MyText</span>

从获得的“文档”中我必须循环并查找元素(使用fizzler组件)。但是出现“&amp; quot”,我无法这样做。

1 个答案:

答案 0 :(得分:4)

添加

后问题已解决
HtmlAgilityPack.HtmlNode.ElementsFlags.Remove("form"); 
HtmlDocument html = new HtmlDocument();
html.OptionAutoCloseOnEnd = true;