我有一个用C#编写的小文本编辑器。
我需要以纯文本格式打开HTML文件(已经完成),并检查正确的开始和结束标记。例如,如果我有这个:
<body> Text </body>
它应该说它是正确的,但如果我有:<body> <body>
它应该说它是错误的。
使用HTML Agility Pack或C#中的Regexp来实现这一目标的任何方式?
答案 0 :(得分:4)
public bool IsCorrectHtml(string html)
{
var htmlDocument = new HtmlDocument();
htmlDocument.LoadHtml(html);
var parseErrors = htmlDocument.ParseErrors;
return !parseErrors.Any(); // return true if no error.
}