Html字符串阅读器

时间:2010-04-22 04:07:46

标签: c# .net html silverlight

我需要加载HTML并解析它,我认为它应该是简单的东西,我传递一个带有“HTML”的字符串,它读取Dom对象中的字符串,所以我可以搜索和解析内容HTML,便于抓取等等。

你们知道这样的事吗。

由于

2 个答案:

答案 0 :(得分:13)

HTML Agility Pack

XmlDocument类似的API,例如(来自示例页面):

 HtmlDocument doc = new HtmlDocument();
 doc.Load("file.htm");
 foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
 {
    HtmlAttribute att = link["href"];
    att.Value = FixLink(att);
 }
 doc.Save("file.htm");

(您还应该能够使用LoadHtml加载一个html字符串,而不是从路径中加载

答案 1 :(得分:2)

如果您在浏览器中运行,您应该能够使用Html DOM Bridge,将HTML加载到其中,然后为此遍历DOM树。