preg_replace与数字字符串数据无法正常工作

时间:2018-07-04 16:02:21

标签: php regex preg-replace

当我处理以数字字符开头的字符串时,我注意到一种奇怪的preg_replace()行为:替换字符串的第一个字符(第一个数字)被截断。我在PHP 5.6.36和PHP 7.0.30中看到了它。

此代码:

<?php

$items = array(
    '1234567890'   => '<a href="http://example.com/1234567890">1234567890</a>',
    '1234567890 A' => '<a href="http://example.com/123456789-a">1234567890 A</a>',
    'A 1234567890' => '<a href="http://example.com/a-1234567890">A 1234567890</a>',
    'Only Text'    => '<a href="http://example.com/only-text">Only Text</a>',
);

foreach( $items as $title => $item ) {
    $search = '/(<a href="[^"]+">)[^<]+(<\/a>)/';
    $replace = '$1' . $title . '$2';

    // Preserve for re-use.
    $_item = $item;

    // Doesn't work -- the titles starting with a number are wonky.
    $item = preg_replace( $search, $replace, $item );
    echo 'Broken: ' . $item . PHP_EOL;

    // Ugly hack to fix the issue.
    if ( is_numeric( substr( $title, 0, 1 ) ) ) {
        $title = ' ' . $title;
    }
    $replace = '$1' . $title . '$2';
    $_item = preg_replace( $search, $replace, $_item );
    echo 'Fixed:  ' . $_item . PHP_EOL;
}

产生以下结果:

Broken: 234567890</a>
Fixed:  <a href="http://example.com/1234567890"> 1234567890</a>
Broken: 234567890 A</a>
Fixed:  <a href="http://example.com/123456789-a"> 1234567890 A</a>
Broken: <a href="http://example.com/a-1234567890">A 1234567890</a>
Fixed:  <a href="http://example.com/a-1234567890">A 1234567890</a>
Broken: <a href="http://example.com/only-text">Only Text</a>
Fixed:  <a href="http://example.com/only-text">Only Text</a>

我已经在https://regex101.com/在线测试了正则表达式,据我所知,它是正确编写的。 (恕我直言,这并不复杂)。

这是一个PHP错误,还是我不完全使用正则表达式?

2 个答案:

答案 0 :(得分:2)

为了避免这种行为,只需将$1更改为${1},与$2相同

foreach( $items as $title => $item ) {
    $search = '/(<a href="[^"]+">)[^<]+(<\/a>)/';
    $replace = '${1}' . $title . '${2}';
    ...

答案 1 :(得分:0)

似乎应该怪我的$replace参数('$1' . $title . '$2')。由于$ title以数字开头,因此将其添加到$ 1中,因此$replace看起来像$11234...$2

解决方案:

$replace = '$1%s$2';
.
.
.
echo sprint( $item, $title );

...的优点是不会在页面标题链接中引入虚假空格。