我需要阅读HTML
文件,并确认已使用HTML
正确关闭了所有Stack
代码。我现在正在阅读文件并找到每个标签时遇到麻烦。我不知道该怎么办。我应该阅读文件的每一行,使用正则表达式查找标签,然后添加到堆栈......还是有更好的方法来做到这一点?
答案 0 :(得分:2)
您尝试使用的每一个手工制作的解决方案都将成为一场噩梦。我真的建议您使用可以正确处理HTML
的外部库。使用HTML Agility Pack这个任务变成了一个笑话:
// your string variable containing HTML
String html = ...
HtmlDocument document = new HtmlDocument();
document.LoadHtml(html);
foreach (HtmlParseError error in document.ParseErrors)
{
Console.WriteLine("ERROR: " + error.Code.ToString());
Console.WriteLine(error.Reason);
Console.WriteLine();
}