Jsoup简单解析

时间:2012-02-28 09:15:18

标签: java android jsoup

我是编程的新手,我一遍又一遍地浏览Jsoup.org的烹饪书和stackoverflow,但我无法让我的应用程序运行。当我尝试从网站解析文本时,应用程序崩溃了。我真的不知道我在哪里弄错了。

我想从html获取此文:

<div id="noga">
<div>
  <h1>Kontakt</h1>
  Agencija RS za okolje<br />
  Vojkova 1b<br />
  1000 Ljubljana, Slovenija<br />
  Tel: +386 (0)1 4784 000<br />
  Fax: +386 (0)1 4784 052<br />
  <a href="mailto:gp.arso@gov.si">gp.arso@gov.si</a>
</div>

我在eclipse中的代码是:

import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class Gumbi2{

    public static void main(String args[]) throws IOException {
        Document doc = Jsoup.connect("http://www.arso.gov.si/vreme/napovedi%20in%20podatki/bio.html").get();
        Elements divs = doc.select("div#noga");

        for (Element div : divs)
            System.out.println(div.text());
    } 
}

有人可以帮助我并指出正确的方向吗?

谢谢!

2 个答案:

答案 0 :(得分:1)

你没有关闭noga div。

答案 1 :(得分:1)

你很亲密。由于noga是一个ID,因此您可以直接使用它,而无需指定div

    Document doc = Jsoup.connect("http://www.arso.gov.si/vreme/napovedi%20in%20podatki/bio.html").get();
    Element nogadiv = doc.getElementById("noga").child(0);
    System.out.println(nogadiv);

由于您需要联系信息,只需抓住noga的第一个孩子。