使用jsoup获取title属性

时间:2014-11-06 19:36:44

标签: java jsoup

我在解析网站时遇到问题。 该网站包含以下短语:

<td class="school">
<abbr title data-original-title="Highschool">...</abbr>
</td>

我如何获得头衔(Highschool)? 我正在用jsoup和java编程。 谢谢你的帮助。

2 个答案:

答案 0 :(得分:2)

试着阅读jsoup cookbook

首先你应该得到 abbr 元素,然后是 data-original-title 属性:

Element abbrElement = doc.select("abbr").first();
String originalTitle = abbrElement.attr("data-original-title");

当然,您应确保选择正确的 abbr 元素。上面的代码将选择出现在文档中的第一个。

答案 1 :(得分:1)

使用jsoup的DOM方法或对已解析文档进行选择可以相对简单地完成。查看这些链接以供参考:

DOM navigation

Extracting attributes

//assuming that the class "school" contains the tag for the title
Elements titles = doc.getElementsByClass("school").getElementsByTag("abbr");
for (Element t: titles) {
   String title= t.attr("data-original-title");
   //do something with the title
}