Java HTML解析Nullpointer异常

时间:2016-01-31 10:49:45

标签: java html parsing nullpointerexception

我正在尝试从<div class="article__content">获取内容,但我得到了NullPointerException,我真的不知道如何解决这个问题,因为我没有那么多的网络知识,也许我使用的标签不正确:/这是我的代码:

public static void main(String []args) throws IOException {
        Document doc = Jsoup.connect("somelink").get();

        String content = doc.getElementById("article__content").text();
       System.out.println(content);
    }

2 个答案:

答案 0 :(得分:1)

你需要使用getElementsByClass函数:

Elements articles = doc.getElementsByClass("article__content");

由于可以有多个具有此类的div,因此该函数返回“Elements”对象。如果你知道shure只有一个这个类的对象,你可以使用它:

Element article = doc.getElementsByClass("article__content").first();

因此,如果要返回在<div>标记之间写入的文本,只需使用text()函数即可。所以它看起来像这样:

System.out.println(article.text());

答案 1 :(得分:1)

或者,如果您可以控制HTML并且只有一个有问题的元素,请重写HTML以使用id属性而不是class