我正在尝试使用JSoup
解析类似于以下内容的结构。
<div class="bigClass">
<a href="foo.com"> Field 1</a>
<a href="bar.com"> Field 2</a>
<a href="baz.com"> Field 3</a>
</div>
现在,我正在使用以下代码来获取 div类“bigClass”的整个文本内容
doc = Jsoup.connect("http://foobar.com").userAgent(userAgent).timeout(1000).get();
price = doc.getElementsByClass("bigClass");
System.out.println(price.text());
我怎样才能获得第一个孩子(“字段1”),无论<a>
类和URL是什么?
类似问题的BeautifulSoup python:Beautiful soup getting the first child
答案 0 :(得分:2)
我可能正在寻找
doc.getElementsByClass("bigClass").first().child(0)
getElementsByClass("bigClass")
返回bigClass
答案 1 :(得分:2)
或者,您可以使用以下两个选项之一:
doc.select("div.bigClass > a:first-of-type");
DEMO:http://try.jsoup.org/~btbp8Fb1xrPf38dTYbplLz5lA3Y
doc.select("div.bigClass > a:first-child");