如何使用htmlagilitypack从Raw html读取所有锚标签

时间:2017-06-22 10:15:58

标签: c# html

这是我的html字符串

string htmlData="<!DOCTYPE html><html><Head></Head><body>&lt;div&gt;&lt;a target=\"_blank\" href=\"http://blender.palmbeachschools.org/GetFile.aspx?f=e9bf5637-c5bd-d4ba-3a1e-cf35ecfcad13\" style=\"font-family: Arial, Helvetica, sans-serif; font-size: large;\"&gt;Breakdown of Standards by Unit &lt;/a&gt;&lt;span style=\"font-size: large; font-family: Arial, Helvetica, sans-serif;\"&gt;&lt;br&gt;&lt;/span&gt;&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;/div&gt;</body></html>"

我必须从这个html中读取所有锚标签。这里的挑战是所有的锚标签都没有被解析。

我尝试使用

HtmlDocument doc = new HtmlDocument();          
doc.LoadHtml(htmltemp);
var pre = doc.DocumentNode.Descendants("a").FirstOrDefault();

它让我无效。

1 个答案:

答案 0 :(得分:0)

       string htmlData = "<a href='1'>First</a><ul><li><a href='1'>Second</a></li><li><a href='1'>Third</a></li></ul>";
        HtmlDocument doc = new HtmlDocument();

        doc.LoadHtml(htmlData);
        var anchorTags = doc.DocumentNode.Descendants("a");

您可以使用此代码。