如何使用Jsoup获取此文本?

时间:2012-02-23 16:44:06

标签: java css-selectors html-parsing jsoup

如何使用Jsoup从以下html代码中获取“this text”?

<h2 class="link title"><a href="myhref.html">this text<img width=10 
        height=10 src="img.jpg" /><span class="blah">
        <span>Other texts</span><span class="sometime">00:00</span></span>
        </a></h2>

当我尝试

String s = document.select("h2.title").select("a[href]").first().text();

它返回

  

本文其他文本00:00

我试着在Jsoup中读取Selector的api,但想不出多少。

另外,我如何获得类class="link title blah"的元素(多个类?)。原谅我,我只知道Jsoup和CSS。

1 个答案:

答案 0 :(得分:9)

使用Element#ownText()代替Element#text()

String s = document.select("h2.link.title a[href]").first().ownText();

请注意,您可以通过将类名选择器连接在一起来选择具有多个类的元素,就像h2.link.title一样,它将选择<h2>元素,这些元素至少 {{1} 1}}和link类。