我需要加载HTML并解析它,我认为它应该是简单的东西,我传递一个带有“HTML”的字符串,它读取Dom对象中的字符串,所以我可以搜索和解析内容HTML,便于抓取等等。
你们知道这样的事吗。
由于
答案 0 :(得分:13)
与XmlDocument
类似的API,例如(来自示例页面):
HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
{
HtmlAttribute att = link["href"];
att.Value = FixLink(att);
}
doc.Save("file.htm");
(您还应该能够使用LoadHtml
加载一个html字符串,而不是从路径中加载
答案 1 :(得分:2)
如果您在浏览器中运行,您应该能够使用Html DOM Bridge,将HTML加载到其中,然后为此遍历DOM树。