我有以下HTML代码:
<div class="description">
<div class='daterange'>
Hello
<span itemprop='startDate'>
June 3, 2011
</span>
</div>
This is some description <i>that</i> I want to fetch
</div><br/>
我想只提取部分:
This is some description <i>that</i> I want to fetch
如何使用jsoup进行操作?
我尝试使用String description = doc.select("div.description").text()
,但后来我收到了所有内容。
答案 0 :(得分:0)
你需要的是创建一个String,它将保存html文件的单词。 这是通过以下代码进行的,doc.body()。text()在没有所有html标签的情况下获取文本。
`public String getWords(String url) {
String text = "";
try {
Document doc = Jsoup.connect(url).get();
text = doc.body().text();
} catch (IOException ioe) {
ioe.printStackTrace();
}
return text;
}
`
答案 1 :(得分:0)
试试这个
String description = doc.select("div").remove().first().html();