禁用perl中的反向引用

时间:2010-09-28 17:41:30

标签: regex perl performance

我被告知在perl中禁用反向引用可以提高性能(前提是你没有使用它们),并且如果你不使用任何反向引用perl就会自行完成。

现在我有一个带有大量正则表达式的perl脚本,只有一个使用反向引用,我想知道以下内容:

  • 鉴于我有大量的正则表达式(假设我的大部分处理时间都是正则表达式),是否会禁用反向引用显着的性能提升?或者我有什么标准可以用来知道是否是这种情况?
  • 有没有办法可以在开始时禁用反向引用,只在需要时重新启用它(我知道(?:,但我不想将其添加到每个分组中)?< / LI>
  • 是否允许perl为我优化这种反向引用行为(即。subeval是否会更改perl是否关闭对其外部事物的反向引用?)

2 个答案:

答案 0 :(得分:15)

使用捕获括号只会惩罚使用它们的正则表达式,因此在需要捕获的位置使用它们,但在需要的只是分组时使用非捕获的parens (?:...)

使用任何全局匹配变量

$` $& $'

所有正则表达式施加了性能损失,因此请尽量避免使用它们。 (但是一旦你做了,就疯了!你已经付出了代价。)没有办法打开和关闭它。一旦Perl检测到它们在任何地方使用(即使在您可能使用的第三方模块中),该功能也会打开。

从Perl 5.10.0开始,全局匹配变量的替代方案只会惩罚使用它们的正则表达式。如果将/p修饰符添加到特定正则表达式,则可以使用

${^PREMATCH} ${^MATCH} ${^POSTMATCH}

代替。

答案 1 :(得分:2)

唯一真正的检查方法是自行分析。看看Benchmark模块(它在核心perl中,所以你不必安装它)。设置几个基准:一个是你有一个函数,有(比方说)十个正则表达式,没有任何反向引用,一个具有相同的十个,但其中一个使用反向引用。

如果您发现反向引用(包括正则表达式)确实会降低其余正则表达式的速度,那么可能会尝试重写那个正则表达式以不包括反向引用...?