解析Stack Overflow页面源代码并获得接受的答案

时间:2015-12-21 02:48:19

标签: html-parsing jsoup

我正在尝试编写一个函数,该函数接受任何Stack Overflow链接的输入URL,获取页面的源代码,解析它,获得接受的答案,并获得最高投票的答案。

我是新手,我不知道该怎么做。这就是我尝试过的。它只是使用jsoup返回第一个答案。

protected void doHtmlParse(String url) {
    // TODO Auto-generated method stub
    Document doc;
    try {
        doc = Jsoup.connect(url).userAgent("Mozilla/5.0 (Windows; U; WindowsNT 5.1; en-US; rv1.8.1.6) Gecko/20070725 Firefox/2.0.0.6")
                  .referrer("http://www.google.com")
                  .get();
        Element answer = doc.select("td[class=answercell]").get(0);
        System.out.println("Answer is  \n" + answer.toString());
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }
}

我只需要显示答案部分,但必须是接受的答案。我该如何处理?

0 个答案:

没有答案