使用Jsoup从html代码中提取数据

时间:2011-03-12 14:00:30

标签: java html-parsing jsoup

我想从这个HTML代码中提取带有Jsoup的单词Mustafa

<h1 id="firstHeading" class="firstHeading">Mustafa</h1>
        <!-- /firstHeading -->

我该怎么做?

1 个答案:

答案 0 :(得分:2)

使用Jsoup,您可以使用CSS selectors来选择元素。使用CSS选择器id="firstHeading"可以选择#firstHeading的元素。

因此,这应该做:

Document document = Jsoup.parse(html);
String firstHeading = document.select("#firstHeading").text();
System.out.println(firstHeading); // Mustafa