这是我的html字符串
string htmlData="<!DOCTYPE html><html><Head></Head><body><div><a target=\"_blank\" href=\"http://blender.palmbeachschools.org/GetFile.aspx?f=e9bf5637-c5bd-d4ba-3a1e-cf35ecfcad13\" style=\"font-family: Arial, Helvetica, sans-serif; font-size: large;\">Breakdown of Standards by Unit </a><span style=\"font-size: large; font-family: Arial, Helvetica, sans-serif;\"><br></span><br><br><br></div></body></html>"
我必须从这个html中读取所有锚标签。这里的挑战是所有的锚标签都没有被解析。
我尝试使用
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(htmltemp);
var pre = doc.DocumentNode.Descendants("a").FirstOrDefault();
它让我无效。
答案 0 :(得分:0)
string htmlData = "<a href='1'>First</a><ul><li><a href='1'>Second</a></li><li><a href='1'>Third</a></li></ul>";
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(htmlData);
var anchorTags = doc.DocumentNode.Descendants("a");
您可以使用此代码。