为什么Pattern.pattern()没有嵌入标志?

时间:2017-02-08 20:12:37

标签: java regex

我最近一直在玩正则表达并注意到了这一点。

Pattern pNoEmbed = Pattern.compile("[ a-z]+", Pattern.CASE_INSENSITIVE);
Pattern pEmbed = Pattern.compile("(?i)[ a-z]+");

这里是应该返回模式字符串的pattern()方法的输出。 toString()似乎也回归了同样的事情。

两者都不区分大小写,所以为什么第一个中没有(?i)
如果我想要它,除了"(?i)" + pattern之外我怎么能得到它?

System.out.println(pNoEmbed.pattern()); // [ a-z]+
System.out.println(pEmbed.pattern()); // (?i)[ a-z]+

为了理智,两者都很好。

String s = "hello World";
System.out.println(pNoEmbed.matcher(s).matches()); // true
System.out.println(pEmbed.matcher(s).matches()); // true

(使用Java 8测试)

更清晰:

我想在另一个

中嵌入一个正则表达式
Pattern p1 = Pattern.compile("[ a-z]+", Pattern.CASE_INSENSITIVE);
Pattern p2 = Pattern.compile(p1.pattern() + "\\s+");

一个不好的例子,因为我知道我可以做到这一点

Pattern p2 = Pattern.compile(p1.pattern() + "\\s+", p1.flags());

但是,基本上,我希望p2.pattern()"(?i)[ a-z]+\\s+"

2 个答案:

答案 0 :(得分:2)

  

两者都有不区分大小写,所以为什么第一个没有(?i)

最直接,因为Pattern.pattern()

  

返回编译此模式的正则表达式。

我想这就是为什么没有额外的或不同的方法返回一个表达原始正则表达式和应用的标志的组合的正则表达式字符串的问题。只有推测性答案是可能的,但我观察到了

  • Pattern还有一个flags()方法,可以通过该方法检索标记。与pattern()一起使用,可以编译一个与原始有效相同的新Pattern,前提是该模式不会全局修改标记(请参阅注释)关于此资格的更多信息的问题。)

  • 可以想象Pattern用户可以用来区分合并到正则表达式字符串中的标志和作为标志单独传递的标志。

  

如果我想要它,除了"(?i)" + pattern之外我怎么能得到它?

据我所知,没有内置的机制来获取你想要的正则表达式字符串。但是,您可以在Pattern.flags()的帮助下构建此类机制。但是,这种机制的基本操作方式可能与你提出的机制没有太大的不同。

答案 1 :(得分:1)

vscode只返回Pattern.pattern()属性,未修改,和 pattern也是如此。您可以说它是Java 1.5规范的缺点。

但是Pattern.toString()前缀是指定模式标志的替代方式

要真正检查标记,请使用(?)

Pattern.flags()

打印:

    System.out.println(pNoEmbed.pattern() + ", flags=" + pNoEmbed.flags());
    System.out.println(pEmbed.pattern() + ", flags=" + pEmbed.flags());

因此,您可以删除[ a-z]+, flags=2 (?i)[ a-z]+, flags=2 ,而只需依靠(?i)