Jsoup返回错误的ChildNode

时间:2015-04-18 08:04:26

标签: parsing jsoup

我想将元数据解析为一本书。 Whild试图检索Booktitle,我注意到我无法从包含TextNode的Element访问ChildNodes。这是我的数据:

<div id="detail_content_wrapper">

                <h1>
                    MyBookTitle 22<br>

                    <span class="sub">

                        subtext
                                                     Book 22
                        by <a href="/buch-autor/foo-bar">Foo Bar</a>
                    </span>

                </h1>

我使用以下方法检索“detail_content_wrapper”中的元素:

Document parsedObject = Jsoup.parse(source);
Element bookNotes = parsedObject.getElementById("detail_content_wrapper");
Element h1Element = bookNotes.getElementsByTag("h1").first()

这将为我提供h1-Tag内的完整内容。

当我看一下h1-Element ChildNodes时,第一个Childnode是一个包含BookName的TextNode。但是当我试图获得第一个孩子的内容时......

 Element bookName = h1Element.children().first();

Element bookName = h1Element.childNode(0);

......在这两种情况下,这将包含第二个节点,即br-Element。

这是一个错误还是我使用Jsoup错了?

0 个答案:

没有答案