在HTML文档中,我有以下标记
<a id="myUniqueID" class="myClassName" href="/uniqueURLToExtract" data-original-title"">This is a Title</a>
我正在使用JSoup,并希望提取href
标识的myUniqueID
中包含的网址。在SO
我想出了这段代码
...
document = Jsoup.connect(mySiteAddress).timeout(10*1000).get();
...
String URLStr = document.select(a[id=myUniqueID]").text();
但这一切都是打印
This is a Title
我尝试了其他的变化,但他们没有成功。我没有打印任何内容或最终导致空指针异常。
我不确定如何在myUniqueID
标记中提取由<a>
标识的网址。
答案 0 :(得分:4)
尝试:
String URLStr = document.select("a[id=myUniqueID]").attr("href");
所以attr()
超过text()
。
答案 1 :(得分:2)
您想获取href
属性,而不是a
的文字:
String href = document.getElementById("myUniqueID").attr("href");