我目前正在使用JSoup CSS选择来获取HTML文档中某些元素的列表。
虽然要验证算法的稳健性,但我必须知道元素的浏览顺序,然后返回。
我的关注与嵌套元素严格相关。如果我搜索文档中的所有元素,如下所示:
<div> Something <span style='color:red;'>special</span> for me </div>
我在JSoup中运行:
Document doc = Jsoup.parse(myCode);
Elements els = doc.select("*");
以哪种顺序遍历这两个元素,因此返回?我目前正在查看select方法的文档页面,但没有提供有关遍历顺序的信息。有没有更精确的参考我可以看一下? 显然,我可以通过反复试验来推断排序,但我想知道这是否已经知道/有人已经深入研究它,因为我不知道我必须解析的文档的HTML结构预先。
谢谢!