如何使用周围表格单元格的id获取链接的内部html

时间:2014-11-20 10:59:39

标签: html-agility-pack

我已经开始使用Html Agility Pack并且非常喜欢它。

我有以下html:

<td id="1"><a href="/offIgo.aspx">This Link</a></td>
<td id="2"><a href="/offIgo.aspx" class="">Not This Link</a></td>

当表格单元格的id为1

时,我想从锚点获取内部html

即。最终结果是我留下了“This Link”

我在传递href时设法得到内部html:

 var doc= new HtmlWeb().Load("mypage);
        var selections = doc.DocumentNode.Descendants("a")
            .Where(u => u.GetAttributeValue("href", null).Contains("offIgo"))
            .Select(a => a.InnerHtml);

但是我如何整合表格信息呢?这是退后一步并从标签中获取所有信息然后再进一步钻进的情况吗?

任何建议表示赞赏

1 个答案:

答案 0 :(得分:0)

好的,找到了对于遇到这种情况的人这样做,请尝试以下方法:

        var doc = new HtmlWeb().Load("myPage");
        HtmlNodeCollection node = doc.DocumentNode.SelectNodes("//table//tbody//tr//td[@id='r1']");
        var myAnchorText = node.Descendants("a")
        .Where(u => u.GetAttributeValue("href", null).Contains("offIgo.aspx"))
        .Select(a => a.InnerHtml);