我想将元数据解析为一本书。 Whild试图检索Booktitle,我注意到我无法从包含TextNode的Element访问ChildNodes。这是我的数据:
<div id="detail_content_wrapper">
<h1>
MyBookTitle 22<br>
<span class="sub">
subtext
Book 22
by <a href="/buch-autor/foo-bar">Foo Bar</a>
</span>
</h1>
我使用以下方法检索“detail_content_wrapper”中的元素:
Document parsedObject = Jsoup.parse(source);
Element bookNotes = parsedObject.getElementById("detail_content_wrapper");
Element h1Element = bookNotes.getElementsByTag("h1").first()
这将为我提供h1-Tag内的完整内容。
当我看一下h1-Element ChildNodes时,第一个Childnode是一个包含BookName的TextNode。但是当我试图获得第一个孩子的内容时......
Element bookName = h1Element.children().first();
或Element bookName = h1Element.childNode(0);
......在这两种情况下,这将包含第二个节点,即br-Element。
这是一个错误还是我使用Jsoup错了?