我是编程的新手,我一遍又一遍地浏览Jsoup.org的烹饪书和stackoverflow,但我无法让我的应用程序运行。当我尝试从网站解析文本时,应用程序崩溃了。我真的不知道我在哪里弄错了。
我想从html获取此文:
<div id="noga">
<div>
<h1>Kontakt</h1>
Agencija RS za okolje<br />
Vojkova 1b<br />
1000 Ljubljana, Slovenija<br />
Tel: +386 (0)1 4784 000<br />
Fax: +386 (0)1 4784 052<br />
<a href="mailto:gp.arso@gov.si">gp.arso@gov.si</a>
</div>
我在eclipse中的代码是:
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class Gumbi2{
public static void main(String args[]) throws IOException {
Document doc = Jsoup.connect("http://www.arso.gov.si/vreme/napovedi%20in%20podatki/bio.html").get();
Elements divs = doc.select("div#noga");
for (Element div : divs)
System.out.println(div.text());
}
}
有人可以帮助我并指出正确的方向吗?
谢谢!
答案 0 :(得分:1)
你没有关闭noga div。
答案 1 :(得分:1)
你很亲密。由于noga
是一个ID,因此您可以直接使用它,而无需指定div
。
Document doc = Jsoup.connect("http://www.arso.gov.si/vreme/napovedi%20in%20podatki/bio.html").get();
Element nogadiv = doc.getElementById("noga").child(0);
System.out.println(nogadiv);
由于您需要联系信息,只需抓住noga
的第一个孩子。