如何从此示例HTML代码中提取全名? 我只想得到以下内容。
全名1
全名2
全名3
<div class="readerP">
<p><a href="link1_english.html" title="Complete" >Full name1</a><br>[ other info ]</br> </p>
</di
<div class="readerP">
<p><a href="link2_english.html" title="Complete" >Full name2</a><br>[ other info ]</br> </p>
</div>
<div class="readerP">
<p><a href="link1_english.html" title="Complete" >Full name3</a><br>[ other info ]</br> </p>
</div>
我正在使用此代码,但它会查看页面中的所有“a”标记,因此我会获得额外的信息,例如。
首页
关于
与
全名1
全名2
全名3
依旧......
try {
doc = Jsoup.connect("http://www.somesite.com").get();
Elements links = doc.getElementsByTag("a");
for (Element el : links) {
linkText = el.ownText();
arr_linkText.add(linkText);
}
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
如何查看“ div ”标记,如果 class =“readerP”,请查看其中的“ a ”标记'的格'?
答案 0 :(得分:0)
如何查看'div'标签,如果class =“readerP”看'a' 'div'里面的标签?
使用适当的选择器,而不只是按标签搜索。
Elements links = doc.select("div .readerP a");
详细了解Jsoup documentation中的选择器。