我刚刚开始使用jsoup,我想在jsoup中提取类似'start nav。* base'的正则表达式。然后我想得到href。在jsoup中,正则表达式不是必须使用它。那么我怎样才能获得像
这样的标签<li class="start nav-fruit-more level-top base">
<a class="level-top" title="All Fruits" href="url link">Fruit</a>
</li>
答案 0 :(得分:2)
您可以使用syntax [attr~=regex]
选择具有与正则表达式匹配的属性值的元素。
以start nav
开头且以base
结尾的字符串的正则表达式为^start(\s)*nav.* base$
,因此您可以尝试使用:
Document doc = Jsoup.parse(content);
System.out.println(doc.select("[class~=^start(\\s)*nav.* base$]").first());