我有这个HTML代码,我需要获取链接
<div class="squaresContent narrow">
<input type="hidden" id="category_path" value="1_Komputery > Części i obudowy komputerowe > Dyski twarde" />
<div class="productItem first2Col first3Col first4Col first">
<a class="productItemContent withNames productsView" href='http://www.okazje.info.pl/km/komputery/samsung-ssd-850-evo-250gb-sata3-2-5-mz-75e250b-eu.html'>
我接下来会这样做:
String ref = null;
for (Element el : doc.getElementsByClass("squaresContent narrow")) {
for (Element elem : el.getElementsByClass("productItem first2Col first3Col first4Col first")
.select("a")) {
ref = elem.attr("abs:href");
}
}
但它不起作用。
我该怎么办?
答案 0 :(得分:2)
getElementsByClass
只能与一个类名一起用作参数。如果您需要多个类名,可以使用css选择器语法,其中类名由.classname
指定,即点后跟类名:
String ref = null;
for (Element el : doc.select(".squaresContent.narrow")) {
for (Element elem : el.select(".productItem.first2Col.first3Col.first4Col.first a")) {
ref = elem.attr("abs:href");
}
}
BTW:你的循环运行效率不高。如果在外部或内部循环中找到多个匹配元素,则覆盖ref变量。更优雅的方式可能是:
String ref = null;
try{
Element aEl = doc.select(".squaresContent.narrow").last()
.select(".productItem.first2Col.first3Col.first4Col.first a").last();
ref = aEl.attr("abs:href");
}
catch (NullPointerException e){
e.printStackTrace();
}
您需要try catch,因为可能没有任何匹配的元素,这会导致NPE。