从包含某些字符串的文档jsoup中提取链接到其他字符串

时间:2012-03-09 15:18:47

标签: java android parsing jsoup

我使用jsoup从网站中提取链接。我想提取一个只包含一些关键字的指定链接。我想检索包含关键字“下载”的链接。怎么做。我有以下代码

Document doc = Jsoup.parse( new URL("http://www.examplesite.com)); 
Element link = doc.select("a").first();

2 个答案:

答案 0 :(得分:3)

有关选择器语法,请参阅here

您可以使用:contains测试节点内的文字,例如Element link = doc.select("a:contains(Download)").first();。如果您愿意,可以使用:matches作为正则表达式。

您可以通过attr方法获取链接地址,例如String linkaddress = link.attr("href");

答案 1 :(得分:0)

你可以用这个

elements with attributes that start with [attr^=value],end with [attr$=value],contain the value [attr*=value] e.g. [href*=/path/]

您希望获取包含特定字词的链接使用此

org.jsoup.select.Elements links = doc.select("[href*=download]");