使用HtmlAgilityPack从HTML文档中删除单个标记

时间:2015-02-25 15:45:07

标签: c# html html-agility-pack

我有一个HTML文档,可能包含未打开或未关闭的标记。我使用HtmlAgilityPack来查找错误,但是一旦我这样做,我就想从文档中删除损坏的标记而不影响任何其他内容。最好的方法是什么?

到目前为止,这是我的代码:

HtmlDocument articleDoc = new HtmlDocument();
articleDoc.LoadHtml(article.ArticleBody);

if (articleDoc.ParseErrors != null && articleDoc.ParseErrors.Count() > 0) {
    foreach (HtmlParseError error in articleDoc.ParseErrors) {
        HtmlParseErrorCode eCode = error.Code;
        if (eCode == HtmlParseErrorCode.TagNotOpened || eCode == HtmlParseErrorCode.TagNotClosed) {
                           //Delete tag here

        }
    }
}

提前感谢您的帮助!

0 个答案:

没有答案