使用堆栈C#在文件中确认有效的HTML标记

时间:2017-12-24 22:34:44

标签: c# html .net stack

我需要阅读HTML文件,并确认已使用HTML正确关闭了所有Stack代码。我现在正在阅读文件并找到每个标签时遇到麻烦。我不知道该怎么办。我应该阅读文件的每一行,使用正则表达式查找标签,然后添加到堆栈......还是有更好的方法来做到这一点?

1 个答案:

答案 0 :(得分:2)

您尝试使用的每一个手工制作的解决方案都将成为一场噩梦。我真的建议您使用可以正确处理HTML的外部库。使用HTML Agility Pack这个任务变成了一个笑话:

// your string variable containing HTML
String html = ...

HtmlDocument document = new HtmlDocument();
document.LoadHtml(html);

foreach (HtmlParseError error in document.ParseErrors)
{
    Console.WriteLine("ERROR: " + error.Code.ToString());
    Console.WriteLine(error.Reason);
    Console.WriteLine();
}