我对HTML解析器(目前使用Jsoup)并不是很了解,并且由于我对它的理解不够而多次尝试并无法使用它,所以请记住这一点。
无论如何,我试图抓取HTML文档的某些部分。这就是我想要提取的内容:
<div class ="detNane" >
<a class="detLink" title="Details for Hock part3">Hock part3</a></div>
显然HTML文档有多个[div class =“detName”],我想提取每个detName div类中的所有文本。我将不胜感激。
感谢您的时间。
答案 0 :(得分:1)
您可以使用选择器:
Document doc = // parse your document here or connect to a website
for( Element element : doc.select("div.detNane") )
{
System.out.println(element.text()); // Print the text of that element
}