我想使用regular-expression检查JAVA中的 URL验证。我发现了this评论,我尝试在我的代码中使用它,如下所示......
private static final String PATTERN_URL = "/((([A-Za-z]{3,9}:(?:\/\/)?)(?:[-;:&=\+\$,\w]+@)?[A-Za-z0-9.-]+(:[0-9]+)?|(?:www.|[-;:&=\+\$,\w]+@)[A-Za-z0-9.-]+)((?:\/[\+~%\/.\w-_]*)?\??(?:[-\+=&;%@.\w_]*)#?(?:[\w]*))?)/";
.....
if (!urlString.matches(PATTERN_URL)) {
System.err.println("Invalid URL");
return false;
}
但是我编写PATTERN_URL
变量时遇到编译时异常。我不知道如何格式化它,我担心如果我修改了它会变成无效的正则表达式。任何人都可以帮我修复它而不会丢失原件吗?谢谢你的帮助。
答案 0 :(得分:4)
你的正则表达式看起来很好。您只需要通过转义所有转义斜杠来格式化Java字符串:
\
- > \\
导致:
"/((([A-Za-z]{3,9}:(?:\\/\\/)?)(?:[-;:&=\\+\\$,\\w]+@)?[A-Za-z0-9.-]+(:[0-9]+)?|(?:www.|[-;:&=\\+\\$,\\w]+@)[A-Za-z0-9.-]+)((?:\\/[\\+~%\\/.\\w-_]*)?\\??(?:[-\\+=&;%@.\\w_]*)#?(?:[\\w]*))?)/"
在Java 将此字符串解释为java.util.regex.Pattern
之后,它将删除那些额外的转义斜杠,并成为您想要的正则表达式。您可以通过打印来证明这一点:
System.out.println(Pattern.compile(PATTERN_URL));