使用HtmlAgilityPack抓取链接

时间:2016-09-13 10:43:13

标签: vb.net xpath html-agility-pack

我需要从以下位置获取每个Profile href链接:

<div class="avatar" style="height:85px; float: left; margin: 7px 0 7px 14px;">
        <span style="font-size: 8px">04.09.16 10:22:42</span>
        <br>
        <a href="/Profile/user_3383.html" alt="example" title="example">

    <img src="http://example.com/noimg.gif" alt="example" class="avatar">
        exampleNick
        </a>
    </div>

所以我想得到:/Profile/user_3383.html

我管理的是:

HtmlUsers.LoadHtml(getRequest("http://example.com/users.html", cookieJar(30)))

                Dim getLink = HtmlUsers.DocumentNode.SelectNodes("//div[@class='avatar']/a/@href")

                For Each profileLink As HtmlAgilityPack.HtmlNode In getLink 
                    ListBox11.Items.Add(profileLink.InnerHtml)
                Next

但我得到的是:

<img src="http://example.com/noimg.gif" alt="example" class="avatar"> exampleNick

你有什么想法为什么它不给我个人资料href?

1 个答案:

答案 0 :(得分:0)

您可以先选择<a>元素,然后将每个href的{​​{1}}属性添加到<a>

ListBox