如何才能使用JSoup获取外部div文本?

时间:2017-04-03 22:54:52

标签: java jsoup

我有以下HTML代码:

<div class="description">
    <div class='daterange'>
        Hello 
     <span itemprop='startDate'>
        June 3, 2011
     </span>
    </div>
    This is some description <i>that</i> I want to fetch
 </div><br/>

我想只提取部分:

This is some description <i>that</i> I want to fetch

如何使用jsoup进行操作?

我尝试使用String description = doc.select("div.description").text(),但后来我收到了所有内容。

2 个答案:

答案 0 :(得分:0)

你需要的是创建一个String,它将保存html文件的单词。 这是通过以下代码进行的,doc.body()。text()在没有所有html标签的情况下获取文本。

`public String getWords(String url) {
        String text = "";
        try {
            Document doc = Jsoup.connect(url).get();
            text = doc.body().text();
        } catch (IOException ioe) {
            ioe.printStackTrace();
        }
        return text;
    }
`

答案 1 :(得分:0)

试试这个

String description = doc.select("div").remove().first().html();