您好我有一个html代码,
<P>This is Stack overflow</p>
<p>---------------</p>
<p>---------------</p>
<p>This is stack overflow2</p>
一般来说,我的html代码中有100个p标签,我需要先选择50个标签。
我需要从<p>
标记中选择包含&#34的所有<p>
标记;这是堆栈溢出&#34; 。直到<p>
标签包含&#34;这是堆栈溢出2&#34;。
是否可以使用jsoup,因为我在java类中使用它。
提前致谢
答案 0 :(得分:0)
不确定您的具体要求,但这是一个开始:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class JsoupTester {
public static void main(String[] args) throws Exception {
String html = "<P>This is Stack overflow</p>"
+ "<p>---------------</p>"
+ "<p>---------------</p>"
+ "<p>This is stack overflow2</p>";
Document doc = Jsoup.parse(html);
Elements elements = doc.select("p");
for(Element e : elements) {
System.out.println(e.text());
}
}
}
现在,您可以调整循环并添加条件,具体取决于您要包含的内容。
这些链接很有帮助: