jsoup选择元素

时间:2012-07-01 16:19:00

标签: java html jsoup

我正在尝试使用jsoup为网站搜索数据。但是在获取一些文本时遇到了一些问题。

部分html看起来像这样

<p class="time">9:00</p>

我可以使用代码行抓住它:

Document doc = Jsoup.connect(url).get();
doc.select("p.time").text());

但是html的下一部分看起来像这样:

<p class="date"><strong>FRIDAY 27<sup>th</sup></strong> JULY 2012</p>

我不知道该怎么做。使用这一行:

doc.select("p.date").text());

给我一​​个空字符串。我已尝试过各种变体(即选择“p.date”然后尝试date.select(“strong”))但只是不断提出一个空字符串。

如何获取该日期文本?

1 个答案:

答案 0 :(得分:1)

无法重现您的问题。

Document doc = Jsoup.parse("<html><body><p class=\"date\"><strong>FRIDAY 27<sup>th</sup></strong> JULY 2012</p></body></html>");
String s = doc.select("p.date").text();
System.out.println(s);

这打印:“2012年7月27日星期五”