Question

我是编程的新手，我一遍又一遍地浏览Jsoup.org的烹饪书和stackoverflow，但我无法让我的应用程序运行。当我尝试从网站解析文本时，应用程序崩溃了。我真的不知道我在哪里弄错了。

我想从html获取此文：

<div id="noga">
<div>
  <h1>Kontakt</h1>
  Agencija RS za okolje<br />
  Vojkova 1b<br />
  1000 Ljubljana, Slovenija<br />
  Tel: +386 (0)1 4784 000<br />
  Fax: +386 (0)1 4784 052<br />
  <a href="mailto:gp.arso@gov.si">gp.arso@gov.si</a>
</div>

我在eclipse中的代码是：

import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class Gumbi2{

    public static void main(String args[]) throws IOException {
        Document doc = Jsoup.connect("http://www.arso.gov.si/vreme/napovedi%20in%20podatki/bio.html").get();
        Elements divs = doc.select("div#noga");

        for (Element div : divs)
            System.out.println(div.text());
    } 
}

有人可以帮助我并指出正确的方向吗？

谢谢！

Answer 1

你没有关闭noga div。

Answer 2

你很亲密。由于noga是一个ID，因此您可以直接使用它，而无需指定div。

    Document doc = Jsoup.connect("http://www.arso.gov.si/vreme/napovedi%20in%20podatki/bio.html").get();
    Element nogadiv = doc.getElementById("noga").child(0);
    System.out.println(nogadiv);

由于您需要联系信息，只需抓住noga的第一个孩子。

Jsoup简单解析

2 个答案: