我需要根据正则表达式在HTML文本中找到图片位置。
e.g。
HTML字符串是:
<div style='background-image: url(http://www.mydomain.com/images/test.jpg);
background-repeat: no-repeat; background-attachment: scroll; height: 400px;'>
我需要定义一个正则表达式,它将找到以http://www.mydomain.com开头并以...结束的字符串的结束位置。
答案 0 :(得分:2)
我会做这样的事情来找到网址:
String input = "<div style='background-image: url(http://www.mydomain.com/images/test.jpg); \n" +
"background-repeat: no-repeat; background-attachment: scroll; height: 400px;'>";
Pattern pattern = Pattern.compile("image:\\surl\\(([^)]+)\\)");
Matcher matcher = pattern.matcher(input);
if (matcher.find()){
String url = matcher.group(1);
System.out.println(url);
}
或
Pattern pattern = Pattern.compile("image:\\surl\\(http://www\\.mydomain\\.com([^)]+)\\)");
如果您想只拥有域名部分
之后的内容答案 1 :(得分:1)
另一种选择是这样的:
www\\.mydomain\\.com.*/([\\w-\\.]*)
在<div style='background-image: url(http://www.mydomain.com/images/test.jpg);
background-repeat: no-repeat; background-attachment: scroll; height: 400px;'>
第1组= test.jpg