我想从一个网站上检索书籍,但是该网站使用不同的html来显示相同的内容。在某些页面中,它有一个div
,后跟一个ul
,然后是li
,如下所示:
<div class="book-description">
<ul>
<li>info 1</li>
<li>info 2</li>
<li>info 3</li>
</ul>
</div>
要遍历li
,我只需做:doc.select("div.book-description > ul > li")
在其他情况下,它直接从div
到li
,如下所示:
<div class="book-description">
<li>info 1</li>
<li>info 2</li>
<li>info 3</li>
</div>
以前的语法不适用于此页面,我需要使用doc.select("div.book-description > li")
我可以使用一种语法来指定可能缺少ul
吗?
答案 0 :(得分:2)
您尝试过doc.select("div.book-description li")
吗?
如果您的列表没有嵌套列表,则此选择器可以。