我正在尝试从<div class="article__content">
获取内容,但我得到了NullPointerException,我真的不知道如何解决这个问题,因为我没有那么多的网络知识,也许我使用的标签不正确:/这是我的代码:
public static void main(String []args) throws IOException {
Document doc = Jsoup.connect("somelink").get();
String content = doc.getElementById("article__content").text();
System.out.println(content);
}
答案 0 :(得分:1)
你需要使用getElementsByClass函数:
Elements articles = doc.getElementsByClass("article__content");
由于可以有多个具有此类的div,因此该函数返回“Elements”对象。如果你知道shure只有一个这个类的对象,你可以使用它:
Element article = doc.getElementsByClass("article__content").first();
因此,如果要返回在<div>
标记之间写入的文本,只需使用text()
函数即可。所以它看起来像这样:
System.out.println(article.text());
答案 1 :(得分:1)
或者,如果您可以控制HTML并且只有一个有问题的元素,请重写HTML以使用id
属性而不是class
。 1}}如果确保只有该类的一个元素,则不推荐练习。