Question

我正在使用HTML Agility包转换

 <font size="1">This is a test</font>

到

 This is a test

使用此代码：

 HtmlDocument doc = new HtmlDocument();
 doc.LoadHtml(html);
 string stripped = doc.DocumentNode.InnerText;

但我遇到了一个问题，我有这个：

 <font size="1">This is a test &amp; this is a joke</font>

并且上面的代码将此转换为

This is a test &amp; this is a joke

但我希望它将其转换为：

This is a test & this is a joke

html敏捷包是否支持我想要做的事情？为什么HTML agiligy代码默认不执行此操作，或者我做错了什么？

Answer 1

您可以在输出上运行HttpUtility.HtmlDecode()。

但请注意，InnerText将包含可能包含在最外层标记内的HTML标记。如果要删除所有标记，则必须遍历文档树并逐位检索所有文本。