从JSoup <a> Tag with Attributes</a>中提取链接

时间:2015-04-10 18:50:36

标签: java html jsoup

在HTML文档中,我有以下标记

<a id="myUniqueID" class="myClassName" href="/uniqueURLToExtract" data-original-title"">This is a Title</a>

我正在使用JSoup,并希望提取href标识的myUniqueID中包含的网址。在SO

上阅读以下主题后
  1. Jsoup - extracting data from an <a> tag, inside a <td> tag

  2. JSoup parsing data from within a tag

  3. 我想出了这段代码

    ...
    document = Jsoup.connect(mySiteAddress).timeout(10*1000).get();
    ...
    String URLStr = document.select(a[id=myUniqueID]").text();
    

    但这一切都是打印

    This is a Title
    

    我尝试了其他的变化,但他们没有成功。我没有打印任何内容或最终导致空指针异常。

    我不确定如何在myUniqueID标记中提取由<a>标识的网址。

2 个答案:

答案 0 :(得分:4)

尝试:

String URLStr = document.select("a[id=myUniqueID]").attr("href");

所以attr()超过text()

答案 1 :(得分:2)

您想获取href属性,而不是a的文字:

String href = document.getElementById("myUniqueID").attr("href");