所有。我正在使用jsoup css seletor进行网页抓取,但不知道如何在2个标签之间获取文本。如下图所示:
<html>
<body>
<a
name =“xxx”>
此处有一些文字</a>
<a
name =“abc”>
文字1 </a
&gt;`
我想在这里得到文字
<a
name =“cde”>
文字1 </a>
</body>
</html>
<a>
的属性名称在hmtl上是唯一的
我发现大多数答案都是在<a>
</a>
任何人都知道如何做到这一点。非常感谢
答案 0 :(得分:0)
好的,我制作了这个适用于我的小代码
String html = "<html> <body><a name = xxx > some text here</a><a name = abc> the text 1 </a>i wanna get the text here<a name = cde>the text 1 </a></body></html>";
Document doc = Jsoup.parse(html);
String body = doc.body().toString();
String[] a = body.split("</a>");
String lista = a[2];
String[] listb = lista.split("<");
String textBetweenA = listb[0];
System.out.println(textBetweenA);