我使用jsoup HTML解析器来过滤URL。我想从结果列表中得到简短的描述,例如:
Stack Overflow是一个私营网站,是该网站的旗舰网站 Stack Exchange Network,由Jeff Atwood和Joel于2008年创建 Spolsky,更开放......
您可以看到上面的网址过滤方法。
Elements links = doc.select("a[href]");
for (Element link : links) {
String temp = link.attr("href");
if(temp.startsWith("/url?q=")){
//use regex to get domain name
result.add(getDomainName(temp));
}
}
答案 0 :(得分:0)
您需要有关谷歌搜索结果中显示内容的元描述。
这个问题就是你要找的: Get title, meta description content using URL
或具体而言,这个答案:https://stackoverflow.com/a/9958448/4807777