Jsoup一个接一个地遍历

时间:2017-07-17 06:38:45

标签: html html5 jsoup

我必须逐个删除每个div的html内容。

<div class="category">      <a href="some url">1</a>    </div>
<div class="category">      <a href="some url">2</a>    </div>
<div class="sub-category">  <ul><li></li>....</ul>      </div>
<div class="category">      <a href="some url">4</a>    </div>
<div class="sub-category">  <ul><li></li>....</ul>      </div>
<div class="category">      <a href="some url">6</a>    </div>

我试过了

element.select("div.category")
element.select("div.sub-category")

它提取数据但不是按顺序提取。

我只想获取一个类别,然后获取其子类别。 另请注意,某些类别没有子类别。 请建议任何人,正确的方法来做到这一点。感谢。

1 个答案:

答案 0 :(得分:0)

您可以使用以下语法:

[attr^=value]: for elements with attributes that start with value
[attr$=value]: end with value
[attr*=value]: contain the value

在您的情况下:&#34;类别&#34; &安培; &#34;子类别&#34;两者都包含子串&#34;类别&#34;以&#34;类别&#34;结束因此你可以使用:

.select("div[class*=category]") or
.select("div[class$=category]")