我想匹配以下字符串:
<a href="http://xyz">xyz</a>
<a href="https://xyz">xyz</a>
<a href="xyz">xyz</a>
我尝试使用正则表达式但失败了:
<a href="((http://|https://|).+)">\1</a>
实现这一目标的正确解决方案是什么? 谢谢!
答案 0 :(得分:5)
以下正则表达式可以做到:
<a\s+href="(?:https?://)?([^"]+)">\1</a>
解释:
<a\s+href=" # match `<a href="`
(?:https?://)? # optionally match `http://` or `https://`
([^"]+) # match one or more chars other than `"`, and store it in group 1
"> # match `">`
\1 # match the same as group 1
</a> # match `</a>`
Java演示:
public class Main {
public static void main(String[] args) {
String[] tests = {
"<a href=\"http://xyz\">xyz</a>",
"<a href=\"https://xyz\">xyz</a>",
"<a href=\"xyz\">xyz</a>",
"<a href=\"xyz\">xyzzz</a>"
};
String regex = "<a\\s+href=\"(?:https?://)?([^\"]+)\">\\1</a>";
for(String test : tests) {
System.out.println(test.matches(regex));
}
}
}
打印:
true
true
true
false
答案 1 :(得分:0)
我认为这就是你所需要的:
<a href="(https?://)?(.+)">\2</a>