我在解析网站时遇到问题。 该网站包含以下短语:
<td class="school">
<abbr title data-original-title="Highschool">...</abbr>
</td>
我如何获得头衔(Highschool)? 我正在用jsoup和java编程。 谢谢你的帮助。
答案 0 :(得分:2)
试着阅读jsoup cookbook。
首先你应该得到 abbr 元素,然后是 data-original-title 属性:
Element abbrElement = doc.select("abbr").first();
String originalTitle = abbrElement.attr("data-original-title");
当然,您应确保选择正确的 abbr 元素。上面的代码将选择出现在文档中的第一个。
答案 1 :(得分:1)
使用jsoup的DOM方法或对已解析文档进行选择可以相对简单地完成。查看这些链接以供参考:
//assuming that the class "school" contains the tag for the title
Elements titles = doc.getElementsByClass("school").getElementsByTag("abbr");
for (Element t: titles) {
String title= t.attr("data-original-title");
//do something with the title
}