使用jsoup在具有多个标签的<div>中提取文本

时间:2019-02-17 22:49:04

标签: java html jsoup

我正在尝试提取给定元素内的文本

<div class="PuzzleDetails-date--1HNzj"><span>Sunday </span>"February 17, 2019"</div>

为此,我使用下面给出的代码:

Elements dates = document.select("div.PuzzleDetails-date--1HNzj");
for (Element date : dates) {
    System.out.println("Date: " + date.text());
}

但是,我看不到任何输出。我想看到这样的输出:

日期:2019年2月17日星期日

1 个答案:

答案 0 :(得分:0)

尝试

div[class='PuzzleDetails-date--1HNzj']

String s ="<div class=\"PuzzleDetails-date--1HNzj\"><span>Sunday </span>\"February 17, 2019\"</div>";
Document doc = Jsoup.parse(s);

Elements dates = doc.select("div[class='PuzzleDetails-date--1HNzj']");
System.out.println(dates.text());

输出:

Sunday "February 17, 2019"