HTML标记位置结束preg_replace_callback

时间:2012-09-13 00:38:10

标签: php regex

这是我正在处理的一个奇怪的扳手。我一直在使用它,使用各种正则表达式,间距和引用变体,但似乎只有关闭</a>标记的位置存在问题。

我已经构建了一个RegEx解析器(我知道)从HTML输出中获取标签,并从我们称之为“短代码”的库中触发每个标签的自定义闭包。它只是替换闭包的返回值的标记,如果闭包不存在,则保留标记。

</a>与我正在抓取的标记位于同一行时,会导致preg_replace_callback失败。当我添加换行符时,一切都完美无瑕。我们在整个地方使用这些标签作为我们模板系统的核心部分,并且它们在其他所有实例中都非常有用。

所以我的问题是......为什么?!这是一个错误还是我的错误?

编辑:更新模式以限制不情愿。关闭</a>代码仍会导致流程失效。 (@Alan Moore)

编辑2:所以,正则表达式是罪魁祸首。在某些情况下,它会将内容拉到同一行的标记之外,但这种模式解决了问题 - '#\[\s*(\w[^\]\s]*)(.*?)\s*\]#i'

HTML失败

<div>
    <a href="[ make_url post_id='200' ]">Some Link</a>
</div>

成功的HTML

<div>
    <a href="[ make_url post_id='200' ]">
        Some Link
    </a>
</div>

<div>
    <a href="[ make_url post_id='200' ]">Some Link
    </a>
</div>

PHP

没有什么花哨的东西,即使我把它简化为基础,它仍然会失败。

$content = 'HTML output from an output buffer';
//$old_pattern = '#\[\s*?(\w+?(?:\.?\w+?)*?(?=\s|\]))(.+)*?\s*?\]#i';
$pattern = '#\[\s*(\w+(?:\.?\w+)*(?=\s|\]))(.+)\s*\]#i';

$content = preg_replace_callback( $pattern, function( $matches ) {
    // Do things with the matches
}, $content );

// Send content back to the template
return $content;

2 个答案:

答案 0 :(得分:0)

Ummm做了一些基本的事情,因为这对你不起作用?

/<a.*?(\[.*?\]).*?>.*?<\/a>/is

E.g。

$matches = null;
$result = 
    preg_match_all('/<a.*?(\[.*?\]).*?>.*?<\/a>/is', '
        <div>
            <a href="[ make_url post_id=\'200\' ]">Some Link</a>
        </div>
        <div>
            <a href="[ make_url post_id=\'200\' ]">
                Some Link
            </a>
        </div>
        <div>
            <a href="[ make_url post_id=\'200\' ]">Some Link
            </a>
        </div>
    ', $matches);
var_dump($matches);

http://codepad.viper-7.com/PM70m1

答案 1 :(得分:0)

事实证明正则表达式是罪魁祸首。在某些情况下,它会将内容拉到同一行的标记之外,但这种模式解决了问题 - #\[\s*(\w[^\]\s]*)(.*?)\s*\]#i