从html获取值

时间:2012-12-03 10:24:44

标签: c# regex

  

可能重复:
  RegEx match open tags except XHTML self-contained tags

我不是很擅长正则表达式。 所以这是我的问题:如何获得它们之间的所有链接 <td><a href="">

<td><a href="link">

2 个答案:

答案 0 :(得分:2)

使用HTML Agility Pack解析HTML文件:

使用DLL后,您可以获取值 使用这样的代码:

linkNode.Attributes["href"]

答案 1 :(得分:1)

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(@"<td><a href=""link"">");

var links = doc.DocumentNode.SelectNodes("//a[@href]")
            .Select(a => a.Attributes["href"].Value)
            .ToList();