使用Jsoup

时间:2016-09-11 10:47:39

标签: java android

我正在尝试使用class库在网站html页面中获取某个名称格式Jsoup属性,问题是我正在使用{按类获取元素{1}}并将其存储到字符串变量中 结果就像这样“迈克·安德罗抢劫银行玛丽亚·杰拉尔多·路易斯......等等”。 但我想要的是分离各个名称并将它们存储到数组中。 以下是代码段:

getElementsByClass("name")

更多信息:

源页面是public String processText(String htmlPage) { Document html = Jsoup.parse(htmlPage); String names = html.body().getElementsByClass("name").text(); return names; } 页面,我将完整的html代码保存在字符串中,然后处理字符串以仅提取html下的元素

我传递给class="name"方法的

htmlPage类似于以下内容:

processText

1 个答案:

答案 0 :(得分:0)

你可以简单地使用split函数从字符串

获取数组
String arr[]=names.trim().split("\\s");

如果在名称之间有空格和制表符,则使用

  String arr[]=names.split("\\s+");

更新

      ArrayList<String>  name=new ArrayList<String>();
      for (Element output: html.body().getElementsByClass("name")) {
          name.add(output.text());
          }

example link

输出:

enter image description here

link to convert list to array