如何获取“dd”标签的文本?

时间:2015-10-03 18:43:25

标签: java html jsoup

enter image description here

所以我想在“dd”-tag中列出所有列出的单词,但我不知道如何获取它们。我的意思是我试过String getWord = doc.getElementsByTag("dd").select("a").attr("href");,但似乎它没有用。获取div的文本没有问题,但我不知道如何从“dd”标记获取文本并尝试getElemenbyTag(“dd”)也不起作用。

网站:http://www.dict.cc/englisch-deutsch/trim.html
任何帮助表示赞赏!

2 个答案:

答案 0 :(得分:1)

使用Jsoup可以使用多种方法。我会这样做:

b

请注意,我需要为此网站设置合适的用户代理以使用html进行响应。

选择器只选择位于dd元素下面的所有元素。

答案 1 :(得分:-1)

对于您提供的链接,这些字词位于 a 标记内,而这些标记又位于 dd 标记内。所以这是通过jQuery提取单词的一种方法:

$("dd").children().each( function (index, element) {
    console.log( $(this).text() ); 
} );

这里我只是打印到控制台的文字。您也可以尝试用html()代替text()。