我有一个HTML文档,可能包含未打开或未关闭的标记。我使用HtmlAgilityPack来查找错误,但是一旦我这样做,我就想从文档中删除损坏的标记而不影响任何其他内容。最好的方法是什么?
到目前为止,这是我的代码:
HtmlDocument articleDoc = new HtmlDocument();
articleDoc.LoadHtml(article.ArticleBody);
if (articleDoc.ParseErrors != null && articleDoc.ParseErrors.Count() > 0) {
foreach (HtmlParseError error in articleDoc.ParseErrors) {
HtmlParseErrorCode eCode = error.Code;
if (eCode == HtmlParseErrorCode.TagNotOpened || eCode == HtmlParseErrorCode.TagNotClosed) {
//Delete tag here
}
}
}
提前感谢您的帮助!