解析特定的div
类时遇到问题。
<div class="box_3 box_3a">
<div class="title_new_2"></div>
<div class="list_indeks_2"></div>
</div>
我尝试使用jsoup选择<div class="list_indeks_2"></div>
,如下所示:
links = doc.select(".list_indeks_2")
但是,此代码不起作用,因为div
的类包含下划线(_
)。如何处理jsoup _
方法中的下划线(select
)?
答案 0 :(得分:2)
尝试根据属性访问元素。
使用JSoup版本1.8.1测试了该代码段。
Document doc = Jsoup.parse(
"<div class=\"box_3 box_3a\">\n"
+ " <div class=\"title_new_2\">some title</div>\n"
+ " <div class=\"list_indeks_2\">some index</div>\n"
+ "</div>");
Elements rows = doc.getElementsByAttributeValue("class", "list_indeks_2");
System.out.println("rows.size() = " + rows.size());
String index = "";
for (Element span : rows) {
index = span.text();
}
System.out.println("index = " + index);
这会产生输出
rows.size() = 1
index = some index