我已经开始使用Html Agility Pack并且非常喜欢它。
我有以下html:
<td id="1"><a href="/offIgo.aspx">This Link</a></td>
<td id="2"><a href="/offIgo.aspx" class="">Not This Link</a></td>
当表格单元格的id为1
时,我想从锚点获取内部html即。最终结果是我留下了“This Link”
我在传递href时设法得到内部html:
var doc= new HtmlWeb().Load("mypage);
var selections = doc.DocumentNode.Descendants("a")
.Where(u => u.GetAttributeValue("href", null).Contains("offIgo"))
.Select(a => a.InnerHtml);
但是我如何整合表格信息呢?这是退后一步并从标签中获取所有信息然后再进一步钻进的情况吗?
任何建议表示赞赏
答案 0 :(得分:0)
好的,找到了对于遇到这种情况的人这样做,请尝试以下方法:
var doc = new HtmlWeb().Load("myPage");
HtmlNodeCollection node = doc.DocumentNode.SelectNodes("//table//tbody//tr//td[@id='r1']");
var myAnchorText = node.Descendants("a")
.Where(u => u.GetAttributeValue("href", null).Contains("offIgo.aspx"))
.Select(a => a.InnerHtml);