如何解析没有名字的'div'?

时间:2014-08-18 11:58:21

标签: java html jsoup

使用Jsoup:

Element movie_div = doc.select("div.movie").first();

我有一个这样的HTML代码:

 
<div class="movie"> 
    <div> 
        <div>
            <strong>Year:</strong> 2014
        </div> 
        <div>
            <strong>Country:</strong> USA
        </div> 
    </div> 
</div>

如何使用jsoup提取国家和年份?

对于示例html,我希望提取的值为"2014""USA"

感谢。

2 个答案:

答案 0 :(得分:1)

使用

Element e = doc.select("div.movie").first().child(0);
List<TextNode> textNodes = e.child(0).textNodes();
String year = textNodes.get(textNodes.size()-1).text().trim();
textNodes = e.child(1).textNodes();
String country = textNodes.get(textNodes.size()-1).text().trim();

答案 1 :(得分:0)

您尝试过类似的事情吗?

Element movie_div = doc.select("div.movie strong").first();

要获得文本值,您应该尝试;

movie_div.text();