如何在大括号内获取嵌套值

时间:2012-07-02 12:56:15

标签: php regex

如何使用php进入嵌套大括号?

示例:

{{ text1 {{text2 text3 {{text4}} text5}} }}

应输出

1- text1 {{text2 text3 {{text4}} text5}}
2- text2 text3 {{text4}} text5
3- text4

3 个答案:

答案 0 :(得分:5)

这需要跟踪括号的数量,并且无法使用正则表达式完成。您必须为此创建自己的解析器逻辑。 Regex is not a parser,抱歉。

Here is another similar question with the same response as mine

And here is a SO about building parses (in Java, but it should translate well enough)

答案 1 :(得分:2)

PCRE,与Perl一样,可以将嵌套结构与任意深度匹配(仅受内存限制 - 见下文)。这是一个经过测试的脚本:

正则表达式匹配嵌套括号

<?php // test.php Rev:20120702_1100

$re_nested_double_bracket ='% # Rev:20120702_1100
    # Match {{...{{...}}...}} structure with arbitrary nesting.
    \{\{                      # Opening literal double bracket.
    (                         # $1: Contents of double brackets.
      (?:                     # Group for contents alternatives.
        [^{}]++               # Either one or more non-brackets,
      | (?R)                  # or a nested bracket pair,
      | \{                    # or the start of opening bracket
        (?!\{)                # (if not a complete open bracket),
      | \}                    # or the start of closing bracket.
        (?!\})                # (if not a complete close bracket).
      )*                      # Zero or more contents alternatives.
    )                         # End $1: Contents of double brackets.
    \}\}                      # Closing literal double bracket.
    %x';

$results = array(); // Global array to receive results.

// Recursively called callback routine adds to $results array.
function _bracket_contents_callback($matches) {
    global $results, $re_nested_double_bracket;
    $results[] = $matches[1];
    preg_replace_callback($re_nested_double_bracket,
        '_bracket_contents_callback', $matches[1]);
    return $matches[0]; // Don't modify string.
}

$input = file_get_contents('testdata.txt');
preg_replace_callback($re_nested_double_bracket,
    '_bracket_contents_callback', $input);

$count = count($results);
printf("There were %d matches found.\n", $count);
for ($i = 0; $i < $count; ++$i) {
    printf("  Match[%d]: %s\n", $i + 1, $results[$i]);
}
?>

当针对原始帖子中的测试数据运行时,这是正则表达式匹配的内容:

示例输出:

There were 3 matches found.
Match[1]: text1 {{text2 text3 {{text4}} text5}}
Match[2]: text2 text3 {{text4}} text5
Match[3]: text4

请注意,此正则表达式匹配最外层可能嵌套的括号集,并将$1组中的内容捕获到括号中。该脚本使用preg_replace_callback()函数递归匹配并将嵌套的括号内容添加到结果数组中。

“任意深度”请注意,此解决方案将嵌套括号与任意“任意深度”匹配,但始终受系统内存,可执行堆栈大小和PHP pcre.backtrack_limit,{{ 1}}和pcre.recursion_limit配置变量。请注意,如果主题字符串太大和/或嵌套对于给定的主机系统来说太深,则此正则表达式解决方案当然可能会失败。 PHP / PCRE库甚至可能导致正在运行的可执行文件生成堆栈溢出,分段错误和程序崩溃!请参阅我对相关问题的回答,深入讨论如何以及为什么会发生这种情况(以及如何避免它并优雅地处理此类错误): RegExp in preg_match function returning browser errorPHP regex: is there anything wrong with this code?

注意:这个问题(和我的答案)几乎与:Parsing proprietary tag syntax with regex - how to detect nested tags?相同,但在这个答案中,提供了一个更全面的解决方案,它递归地匹配并存储所有嵌套的括号内容。

答案 2 :(得分:0)

我找到了我正在寻找的答案并把它放在这里所以每个人都可以使用它。它的确非常简单,只有一行:

  $text1=preg_replace("/\{\{(([^{}]*|(?R))*)\}\}/",'',$text1);

它将搜索并替换所有{{text}}与您想要的任何内容。您还可以使用preg_match_all将所有这些内容放入数组中。