HtmlAgilityPack抓取" href"

时间:2014-10-24 08:27:23

标签: c# html html-agility-pack

我写了这段代码。:

警告,链接指向成人网站!!!

        var getHtmlWeb = new HtmlWeb();
        var document = getHtmlWeb.Load("http://xhamster.com/movies/2808613/jewel_is_a_sexy_cougar_who_loves_to_fuck_lucky_younger_guys.html");
        var aTags = document.DocumentNode.SelectNodes("//div[contains(@class,'noFlash')]"); 


        if (aTags != null)

        foreach (var aTag in aTags)
        {

            var href = aTag.Attributes["href"].Value;

            textBox2.Text = href;

        } 

我尝试运行此程序时出错。

如果我将其他东西放入" var href"例如。:

var href = aTag.InnerHtml

我得到了内部文本,我可以在那里看到" href ="链接和其他一些数据。

但我只需要href之后的链接!

1 个答案:

答案 0 :(得分:2)

您正在选择div元素。 div元素不具有href属性。如果您想获得href的锚标记,可以使用:

var hrefs = aTags.Descendants("a")
           .Select(node => node.GetAttributeValue("href","")) 
           .ToList();