如何使用Jsoup从以下html代码中获取“this text”?
<h2 class="link title"><a href="myhref.html">this text<img width=10
height=10 src="img.jpg" /><span class="blah">
<span>Other texts</span><span class="sometime">00:00</span></span>
</a></h2>
当我尝试
时String s = document.select("h2.title").select("a[href]").first().text();
它返回
本文其他文本00:00
我试着在Jsoup中读取Selector的api,但想不出多少。
另外,我如何获得类class="link title blah"
的元素(多个类?)。原谅我,我只知道Jsoup和CSS。
答案 0 :(得分:9)
使用Element#ownText()
代替Element#text()
。
String s = document.select("h2.link.title a[href]").first().ownText();
请注意,您可以通过将类名选择器连接在一起来选择具有多个类的元素,就像h2.link.title
一样,它将选择<h2>
元素,这些元素至少 {{1} 1}}和link
类。