使用Jsoup Java进行HTML解析

时间:2014-02-19 22:03:40

标签: html-parsing jsoup

 <select id="list">
 <option value="0">First</option>
 <option value="1">Second</option>
 <option value="2">Third</option>
 </select>

对于上面的html内容,我如何利用Jsoup解析并获取文本

  First Second Third

当我使用

Document doc=Jsoup.parse(HTMLText);
String text=doc.text();
System.out.println(text);

我得到这样的东西

FirstSecondThird

1 个答案:

答案 0 :(得分:1)

您已经非常接近解决方案;只需选择您需要的元素并获取其文本:

    final String html = " <select id=\"list\">\n"
            + " <option value=\"0\">First</option>\n"
            + " <option value=\"1\">Second</option>\n"
            + " <option value=\"2\">Third</option>\n"
            + " </select>";

    Document doc = Jsoup.parse(html);
    String text = doc.select("option").text(); // Select all 'option' tags --> get text of them

    System.out.println(text);

结果:

First Second Third