给出下面的示例HTML。如何获取图片链接http://lis.deped.gov.ph/uis/assets/rev/2630813/images/deped-logo.gif ?
Just in case the image link starts in
// like
// uis / assets / rev / 2630813 / images / deped-logo.gif`我只需要添加一个字符串在它之前。
如何使用正则表达式?我不想使用http库。
<div class="navbar-header"><button type="button" class="navbar-toggle" data-toggle="collapse" data-target="#deped-uis-nav-collapse"><span class="sr-only">Toggle navigation</span><span class="icon-bar"></span><span class="icon-bar"></span><span class="icon-bar"></span></button><span class="navbar-brand"><img class="logo" src="http://lis.deped.gov.ph/uis/assets/rev/2630813/images/deped-logo.gif" alt="DepEd" style="height: 20px; margin-top: -2px"></span></div>
答案 0 :(得分:2)
您可以使用JSoup ..
请参阅以下代码..您需要添加JSoup库才能使其正常工作。
String html = "<html>your html code goes here</html>";
Document doc = Jsoup.parse(html);
Elements image = doc.getElementsByTag("img");
for (Element el : image) {
String src = el.absUrl("src");
System.out.println("src attribute is : "+src);
}
答案 1 :(得分:-1)
不需要库,使用正则表达式,因为它是一个简单的操作,你的程序应该尽可能轻量级
类似于:
src="//(.*?)"
然后,将Java String
replaceAll(String regex,
String replacement)与重建的字符串一起使用。