Question

我正在阅读包含来自Google搜索结果的HTML代码的文本文件。然后我解析它，我尝试用这段代码提取链接：

FileReader in = new FileReader("A.txt");
BufferedReader p = new BufferedReader(in);
while(p.readLine() != null)
{
  String html = p.readLine();
  Document doc = Jsoup.parse(html);
  Elements Link = doc.select("a[href");
  for(Element element :Link)
  {   
    if(element != null)
    {
       System.out.println(element);
    }
  }
}

但我有很多非链接字符串。如何显示链接，而不是其他任何内容？

Answer 1

请使用完整的选择器再试一次，而不仅仅是“a [href”：

Elements links = doc.select("a[href]"); // a with href

请参阅Selector文档获取完整支持 - 尤其是右侧的示例。

如何从Google HTML结果页面中提取链接？

1 个答案: