我正在尝试使用class
库在网站html
页面中获取某个名称格式Jsoup
属性,问题是我正在使用{按类获取元素{1}}并将其存储到字符串变量中
结果就像这样“迈克·安德罗抢劫银行玛丽亚·杰拉尔多·路易斯......等等”。
但我想要的是分离各个名称并将它们存储到数组中。
以下是代码段:
getElementsByClass("name")
更多信息:
源页面是public String processText(String htmlPage) {
Document html = Jsoup.parse(htmlPage);
String names = html.body().getElementsByClass("name").text();
return names;
}
页面,我将完整的html代码保存在字符串中,然后处理字符串以仅提取html
下的元素
class="name"
方法的 htmlPage
类似于以下内容:
processText
答案 0 :(得分:0)
你可以简单地使用split
函数从字符串
String arr[]=names.trim().split("\\s");
如果在名称之间有空格和制表符,则使用
String arr[]=names.split("\\s+");
更新
ArrayList<String> name=new ArrayList<String>();
for (Element output: html.body().getElementsByClass("name")) {
name.add(output.text());
}
输出: