我正在使用jSoup从网站的html中提取信息。但是我在以下情况下遇到了获取数据的问题。我正在使用的HTML包含下面的一部分,我想获得所有这些图像网址
<ul class="myClass">
<li>
<a>
<img src="myImageSrc1.png"/>
</a>
</li>
<li>
<a>
<img src="myImageSrc2.png"/>
</a>
</li>
</ul>
我的使用方法如下:
doc = Jsoup.connect("http://www.myUrl").get();
castsImageUrl = doc.select("ul.cast > li > a > img");
for (Element el : castsImageUrl)System.out.println(el.text());
但我一无所获。我无法弄清楚我的问题。任何人都可以帮我修好
答案 0 :(得分:5)
根据您提供的确切HTML,您可以通过调用attr(String key)
方法并传入src
(请参阅docs)来提取图片网址。例如:
String html = "<ul class='myClass'><li><a><img src='myImageSrc1.png'/></a></li><li><a><img src='myImageSrc2.png'/></a></li></ul>";
Document doc = Jsoup.parse(html);
Elements castsImageUrl = doc.select("ul.myClass > li > a > img");
for (Element el : castsImageUrl) System.out.println(el.attr("src"));
哪个输出:
11-06 09:45:11.313: I/System.out(454): myImageSrc1.png
11-06 09:45:11.313: I/System.out(454): myImageSrc2.png