Java从网页获取单个元素

时间:2014-06-07 14:28:12

标签: java web controls elements

嗨,所以经过一些搜索仍然没有找到答案,但我想得到一个网页的单个元素到一个字符串变量。我知道如何在C中做到这一点,但想知道在java

例如:

document.nav(the webpage)
String value = document.getElementbyid(theid)

由于

所以例如:

某些网页

<body>
<P id=element1>the value i want</p>
</body>

我需要从网页获取该值到String变量

1 个答案:

答案 0 :(得分:2)

您可以使用jsoup

String url = "http://www.example.com"; // or whatever goes here
Document document = Jsoup.connect(url).followRedirects(false).timeout(60000/*wait up to 60 sec for response*/).get();
String value = document.body().select("#element1" /*css selector*/).get(0).text();

如果您需要其他输入格式,请参阅the cookbook

没有必要指定超时等。用于连接。你可以使用

Document document = Jsoup.connect(url).get();

如果网页需要很长时间加载,我只包含超时。您也可能想要关注重定向。