使用Jsoup CSS选择器为2个元素之间的文本

时间:2014-07-06 09:40:47

标签: html css jsoup

所有。我正在使用jsoup css seletor进行网页抓取,但不知道如何在2个标签之间获取文本。如下图所示:

<html>
<body>

<a name =“xxx”>此处有一些文字</a>

<a name =“abc”>文字1 </a&gt;`

我想在这里得到文字

<a name =“cde”>文字1 </a>

</body>
</html>

<a>的属性名称在hmtl上是唯一的

我发现大多数答案都是在<a> </a>

之间提取文字

任何人都知道如何做到这一点。非常感谢

1 个答案:

答案 0 :(得分:0)

好的,我制作了这个适用于我的小代码

String html = "<html> <body><a name = xxx > some text here</a><a name = abc> the text 1 </a>i wanna get the text here<a name = cde>the text 1 </a></body></html>";
    Document doc = Jsoup.parse(html);
    String body = doc.body().toString();
    String[] a = body.split("</a>");
    String lista = a[2];
    String[] listb = lista.split("<");      
    String textBetweenA = listb[0];
    System.out.println(textBetweenA);