我正在使用名为Jsoup的库。我的目标是仅从此站点提供的列表中获取列表项:
[https://uzdarbis.lt/f109/it-darbo-pasiulymai/][1]
这是我在Android中编写的代码:
Document doc = Jsoup.connect("https://uzdarbis.lt/f109/it-darbo-pasiulymai/").get();
Elements links = doc.select("a[href]");
for(org.jsoup.nodes.Element elem : links){
Log.i(TAG, i +" "+elem.attr("abs:href"));
}
这是我的问题,我得到了该页面的所有链接。我怎么过滤它?
答案 0 :(得分:1)
目前,您的选择器会选择具有a
属性的每个href
元素。如果您只想选择部分链接,则需要使选择器更具体。
您没有准确指定所需的链接,因此我假设您要选择主题标题链接。为此,您需要找到可以添加到选择器的a
元素的其他属性 - 通常是属性,但也可能是与其他页面元素的关系(例如“始终是{的子元素” {1}}元素。。在这种情况下,它很简单:主题标题链接都有类td
,因此您将选择器更改为
topic_title
假设您想要选择主题表中的所有链接(主题标题和其他链接)。在这里,您只想选择身份Elements links = doc.select("a.topic_title[href]");
为a
的(直接或间接)子女的table
元素:
forum_table
如果您想要其他内容,则应使用浏览器的“检查元素”功能查看所需的元素及其父级,以查找可在选择器中使用的属性。您可以查看selector documentation以查看可以使用的属性。