从Google搜索结果中获取简短描述部分

时间:2015-05-05 08:13:02

标签: java html-parsing jsoup

我使用jsoup HTML解析器来过滤URL。我想从结果列表中得到简短的描述,例如:

  Stack Overflow是一个私营网站,是该网站的旗舰网站   Stack Exchange Network,由Jeff Atwood和Joel于2008年创建   Spolsky,更开放......

您可以看到上面的网址过滤方法。

    Elements links = doc.select("a[href]");
    for (Element link : links) {

        String temp = link.attr("href");        
        if(temp.startsWith("/url?q=")){
                            //use regex to get domain name
            result.add(getDomainName(temp));
        }

    }

1 个答案:

答案 0 :(得分:0)

您需要有关谷歌搜索结果中显示内容的元描述。

这个问题就是你要找的: Get title, meta description content using URL

或具体而言,这个答案:https://stackoverflow.com/a/9958448/4807777