Question

我想将元数据解析为一本书。 Whild试图检索Booktitle，我注意到我无法从包含TextNode的Element访问ChildNodes。这是我的数据：

<div id="detail_content_wrapper">

                <h1>
                    MyBookTitle 22<br>

                    <span class="sub">

                        subtext
                                                     Book 22
                        by <a href="/buch-autor/foo-bar">Foo Bar</a>
                    </span>

                </h1>

我使用以下方法检索“detail_content_wrapper”中的元素：

Document parsedObject = Jsoup.parse(source);
Element bookNotes = parsedObject.getElementById("detail_content_wrapper");
Element h1Element = bookNotes.getElementsByTag("h1").first()

这将为我提供h1-Tag内的完整内容。

当我看一下h1-Element ChildNodes时，第一个Childnode是一个包含BookName的TextNode。但是当我试图获得第一个孩子的内容时......

 Element bookName = h1Element.children().first();

或Element bookName = h1Element.childNode(0);

......在这两种情况下，这将包含第二个节点，即br-Element。

这是一个错误还是我使用Jsoup错了？

Jsoup返回错误的ChildNode

0 个答案: