如何在Jsoup中获取给定单词的标记名称?

时间:2015-06-20 06:30:09

标签: java jsoup

我有一些像这样的HTML代码:

<div class="post-text" itemprop="text"><a href="something.com">sometext for example</a></div>

我正在使用jsoup搜索某些文字,我想要它的标签名称。对于上面的示例,它将是a href。任何人都可以帮助我吗?

1 个答案:

答案 0 :(得分:0)

试试这个CSS选择器:

*:containsOwn(sometext)

样本

http://try.jsoup.org/~1FKtzLpHQFii4u8FFyUuh3GgdPI

示例代码

String html = "<div class=\"post-text\" itemprop=\"text\"><a href=\"something.com\">sometext for example</a></div>";

Document doc = Jsoup.parse(html);
Elements elts = doc.select("*:containsOwn(sometext)");

for(Element e : elts) {
   System.out.println(e.outerHtml());
}

输出

<a href="something.com">sometext for example</a>

另请参阅

  • :matchesOwn(regex) - 如果您想查找包含更精细文字的元素。
  • Jsoup CSS selector - Jsoup支持的CSS选择器的完整参考