我正在使用Java和Jsoup来解析HTML页面,我希望得到所有不包含其他div的div来打印它包含的文本。
但是,例如,如果一个div包含一个表,并且该表包含一个div,我不想要它。我只想要最底层的div,里面没有其他div(另一个标签可以)。
我是怎么做到的?
Primarilly,我想知道是否有一些语法可用于select()
方法。
答案 0 :(得分:1)
Document doc; //comes as parameter
Elements divs = doc.getElementsByTag("div");
for(Element div: divs){
if(div.getElementsByTag("div").size() == 1){
//is a div with no divs inside it
}
}