我正在使用Html Agility Pack来解析一些可能包含重叠标签的HTML。
这是一个简单的方法:
var len = list[i].information && list[i].information.locations? list[i].information.locations.length: 0;
for (var y = 0; y < len; y++) {
public string Parse(string html)
{
var doc = new HtmlDocument();
doc.LoadHtml(html);
var sb = new StringBuilder();
using (var sw = new StringWriter(sb))
doc.Save(sw);
return sb.ToString();
}
input = "<b>bold <i>bold italic</b> italic</i>";
expected = "<b>bold <i>bold italic</i></b><i> italic</i>";
actual = "<b>bold <i>bold italic</i></b> italic";
上还会输出TagNotOpened
解析器错误。
我尝试过使用</i>
以及将输入放在其他各种标签中但没有效果。
我的预期结果是“斜体”一词应该是斜体,但标签不应重叠 - 它应该在OptionOutputAsXml
之前关闭并在之后重新打开。有没有办法通过HAP或类似的库获得我的预期结果?