使用jsoup进行嵌套标记提取

时间:2017-07-19 14:25:09

标签: java jsoup

如何使用jsoup迭代特定标签中的所有标签?例如,HTML文件看起来像

<br><input ....>
    <A HREF=...> <i>some texts</i>
    <A HREF=...>
<br><input ....>
    <A HREF=...> <i>some texts</i>
    <A HREF=...>
<br><input ....>
    <A HREF=...> <i>some texts</i>
    <A HREF=...>
...

因此,对于每个br,我想迭代标记inputaia。声明

Element element = doc.select("br").first();

仅返回不合适的br

更新:

如果我使用Elements element = doc.select("br");,那么如何迭代element?如果我使用

Elements element = doc.select("br");
Element e2 = element.get(0).select("i").first();

然后e2将为null !!

1 个答案:

答案 0 :(得分:0)

您无法阅读input中的aiabr,因为br没有孩子,因为那是select:选择元素的子元素

问题出现在聊天中 - 一旦确定就会编辑