正则表达式JAVA中URL的字符串

时间:2014-02-26 04:17:04

标签: java regex

我想使用regular-expression检查JAVA中的 URL验证。我发现了this评论,我尝试在我的代码中使用它,如下所示......

private static final String PATTERN_URL = "/((([A-Za-z]{3,9}:(?:\/\/)?)(?:[-;:&=\+\$,\w]+@)?[A-Za-z0-9.-]+(:[0-9]+)?|(?:ww‌​w.|[-;:&=\+\$,\w]+@)[A-Za-z0-9.-]+)((?:\/[\+~%\/.\w-_]*)?\??(?:[-\+=&;%@.\w_]*)#?‌​(?:[\w]*))?)/";


.....
if (!urlString.matches(PATTERN_URL)) {
  System.err.println("Invalid URL");
  return false;
}

但是我编写PATTERN_URL变量时遇到编译时异常。我不知道如何格式化它,我担心如果我修改了它会变成无效的正则表达式。任何人都可以帮我修复它而不会丢失原件吗?谢谢你的帮助。

1 个答案:

答案 0 :(得分:4)

你的正则表达式看起来很好。您只需要通过转义所有转义斜杠来格式化Java字符串:

\ - > \\

导致:

"/((([A-Za-z]{3,9}:(?:\\/\\/)?)(?:[-;:&=\\+\\$,\\w]+@)?[A-Za-z0-9.-]+(:[0-9]+)?|(?:ww‌​w.|[-;:&=\\+\\$,\\w]+@)[A-Za-z0-9.-]+)((?:\\/[\\+~%\\/.\\w-_]*)?\\??(?:[-\\+=&;%@.\\w_]*)#?‌​(?:[\\w]*))?)/"

在Java 将此字符串解释为java.util.regex.Pattern之后,它将删除那些额外的转义斜杠,并成为您想要的正则表达式。您可以通过打印来证明这一点:

System.out.println(Pattern.compile(PATTERN_URL));