使用Jsoup在html标签之后获取文本并创建ArrayList

时间:2012-09-06 02:58:56

标签: java jsoup

我正在尝试使用Jsoup将HTML文档中的文本导入ArrayList。我的文档看起来像这样。

<p>
   <b>1</b>First Text
   <b>2</b>Second Text
   <b>3</b>Third Text
   .
   .
   .
   .
</p>

从上面的文档中,我想创建如下的数组。

list{[First Text],[Second Text],[Third Text]}

感谢您的帮助。

尝试使用以下代码,但仅获取数字。

Document doc1 = Jsoup.parse(chapter);
Element vve = doc1.body();
Elements vvv = doc1.select("p").select("b");

我的结果是

vvv.get(0) = <b>1</b>
vvv.get(1) = <b>2</b>
.
.
.

3 个答案:

答案 0 :(得分:3)

以下是我昨晚完成的完整代码。

        Elements elements = doc.body().select("p").select("b");
        for(int i=0; i<elements.size(); i++){
            Element para = elements.get(i);
            versesList.add(para.nextSibling().toString());
        }

答案 1 :(得分:0)

这将有助于

Elements elements = doc.body().select("p");

for(int j=0;j<elements.size();j++){
     Element para = tblelements.get(j);
     String value = para.select("b").get(i).text();
}

答案 2 :(得分:0)

让我们试试这个:

final String html = "<p> ... "; // your HTML here

Document doc = Jsoup.parse(html);
List<String> list = new ArrayList<>();


for( Element element : doc.select("b") )
{
    list.add(element.nextSibling().toString());
}

注意:您也可以使用List<Node>,然后您只需要移除toString()电话。