我正在尝试使用Jsoup将HTML文档中的文本导入ArrayList。我的文档看起来像这样。
<p>
<b>1</b>First Text
<b>2</b>Second Text
<b>3</b>Third Text
.
.
.
.
</p>
从上面的文档中,我想创建如下的数组。
list{[First Text],[Second Text],[Third Text]}
感谢您的帮助。
尝试使用以下代码,但仅获取数字。
Document doc1 = Jsoup.parse(chapter);
Element vve = doc1.body();
Elements vvv = doc1.select("p").select("b");
我的结果是
vvv.get(0) = <b>1</b>
vvv.get(1) = <b>2</b>
.
.
.
答案 0 :(得分:3)
以下是我昨晚完成的完整代码。
Elements elements = doc.body().select("p").select("b");
for(int i=0; i<elements.size(); i++){
Element para = elements.get(i);
versesList.add(para.nextSibling().toString());
}
答案 1 :(得分:0)
这将有助于
Elements elements = doc.body().select("p");
for(int j=0;j<elements.size();j++){
Element para = tblelements.get(j);
String value = para.select("b").get(i).text();
}
答案 2 :(得分:0)
让我们试试这个:
final String html = "<p> ... "; // your HTML here
Document doc = Jsoup.parse(html);
List<String> list = new ArrayList<>();
for( Element element : doc.select("b") )
{
list.add(element.nextSibling().toString());
}
注意:您也可以使用List<Node>
,然后您只需要移除toString()
电话。