缺少预期的重叠标签

时间:2016-06-23 09:35:04

标签: c# html html-agility-pack

我正在使用Html Agility Pack来解析一些可能包含重叠标签的HTML。

这是一个简单的方法:

var len = list[i].information && list[i].information.locations? list[i].information.locations.length: 0;
for (var y = 0; y < len; y++) {

public string Parse(string html) { var doc = new HtmlDocument(); doc.LoadHtml(html); var sb = new StringBuilder(); using (var sw = new StringWriter(sb)) doc.Save(sw); return sb.ToString(); } input = "<b>bold <i>bold italic</b> italic</i>"; expected = "<b>bold <i>bold italic</i></b><i> italic</i>"; actual = "<b>bold <i>bold italic</i></b> italic"; 上还会输出TagNotOpened解析器错误。

我尝试过使用</i>以及将输入放在其他各种标签中但没有效果。

我的预期结果是“斜体”一词应该是斜体,但标签不应重叠 - 它应该在OptionOutputAsXml之前关闭并在之后重新打开。有没有办法通过HAP或类似的库获得我的预期结果?

1 个答案:

答案 0 :(得分:0)

AngleSharp达到了预期的效果,并且仍在积极维护。

如果使用Html Agility Pack无法做到这一点,我会将此标记为答案。