像这样的正则表达式模式和返回数组

时间:2013-08-05 15:02:08

标签: php regex preg-match-all

我想从像wordpress短代码这样的字符串返回数组,但我希望数组就像示例

我有这个字符串

$str = 'codes example : [code lang="php"]<?php  echo "Hello Wold" ; ?>[/code]  [code lang="html"]<b>Hello</b>[/code]' ;

我希望返回包含

array(
   array(
     'code' => '[code lang="php"]<?php  echo "Hello Wold" ; ?>[/code]' ,
     'function' => 'code' ,
     'attr' => array( 'lang' => 'php' ) ,
     'value' => '<?php  echo "Hello Wold" ; ?>'
   ) ,
   array(
     'code' => '[code lang="html"]<b>Hello</b>[/code]' ,
     'function' => 'code' ,
     'attr' => array( 'lang' => 'html' ) ,
     'value' => '<b>Hello</b>'
   )
)

我尝试使用 preg_match_all

进行此操作

我使用了这种模式/[[a-z]{3,}+ *[a-z]{2,}=(.*)+ *](.*)[\/[a-z]{3,}]/U

,结果是

Array ( [0] => Array ( [0] => [link href="http://www.php.net" text="php"][/link] [1] => [code lang="php"][/code] [2] => [code lang="html"]Hello[/code] ) [1] => Array ( [0] => " [1] => " [2] => " ) [2] => Array ( [0] => [1] => [2] => Hello ) )

3 个答案:

答案 0 :(得分:1)

你应该写一个解析器。这可能看起来非常复杂,但实际上它非常简单。你只需要跟踪一些事情。

概要

  • 逐个字符地读取字符串
  • 如果您看到自己看到的[记录,那么您现在正在寻找]
  • 如果您在"之前看到],则需要先找到另一个"
  • 当您看到]时,您会知道'功能'和'attr'
  • 当你找到'/ function'时你会知道'value'

通过这些简单的检查,您可以构建一个令牌列表,例如您的示例输出。

答案 1 :(得分:0)

您需要使用命名组: http://www.regular-expressions.info/named.html

摘录:

(?Pgroup)将组的匹配捕获到后向引用“名称”

编辑:所以你需要将命名组想法插入你的正则表达式。

答案 2 :(得分:0)

您可以尝试这样的事情:

preg_match_all(
    '#(?P<block>\[(?P<tag>[a-z]{3,})\s*(?P<attr>[a-z-_]+="[^\]]+")*\](?P<content>((?!\[/(?P=tag)).)*)\[/(?P=tag){1}\])#',
    'codes example : [code lang="php" test="true"]<?php  echo "Hello Wold" ; ?>[/code] [code lang="js"]console.log(\'yeah!\')[/code] [noattr]no attr content[/noattr]',
    $matches,
    PREG_SET_ORDER
);
foreach ($matches as &$match) {
    $match = array_intersect_key($match, array_flip(array('block', 'tag', 'attr', 'content')));;
}
print_r($matches);

结果应为:

Array
(
    [0] => Array
        (
            [block] => [code lang="php" test="true"]<?php  echo "Hello Wold" ; ?>[/code]
            [tag] => code
            [attr] => lang="php" test="true"
            [content] => <?php  echo "Hello Wold" ; ?>
        )

    [1] => Array
        (
            [block] => [code lang="js"]console.log('yeah!')[/code]
            [tag] => code
            [attr] => lang="js"
            [content] => console.log('yeah!')
        )

    [2] => Array
        (
            [block] => [noattr]no attr content[/noattr]
            [tag] => noattr
            [attr] =>
            [content] => no attr content
        )

)