当我处理以数字字符开头的字符串时,我注意到一种奇怪的preg_replace()
行为:替换字符串的第一个字符(第一个数字)被截断。我在PHP 5.6.36和PHP 7.0.30中看到了它。
此代码:
<?php
$items = array(
'1234567890' => '<a href="http://example.com/1234567890">1234567890</a>',
'1234567890 A' => '<a href="http://example.com/123456789-a">1234567890 A</a>',
'A 1234567890' => '<a href="http://example.com/a-1234567890">A 1234567890</a>',
'Only Text' => '<a href="http://example.com/only-text">Only Text</a>',
);
foreach( $items as $title => $item ) {
$search = '/(<a href="[^"]+">)[^<]+(<\/a>)/';
$replace = '$1' . $title . '$2';
// Preserve for re-use.
$_item = $item;
// Doesn't work -- the titles starting with a number are wonky.
$item = preg_replace( $search, $replace, $item );
echo 'Broken: ' . $item . PHP_EOL;
// Ugly hack to fix the issue.
if ( is_numeric( substr( $title, 0, 1 ) ) ) {
$title = ' ' . $title;
}
$replace = '$1' . $title . '$2';
$_item = preg_replace( $search, $replace, $_item );
echo 'Fixed: ' . $_item . PHP_EOL;
}
产生以下结果:
Broken: 234567890</a>
Fixed: <a href="http://example.com/1234567890"> 1234567890</a>
Broken: 234567890 A</a>
Fixed: <a href="http://example.com/123456789-a"> 1234567890 A</a>
Broken: <a href="http://example.com/a-1234567890">A 1234567890</a>
Fixed: <a href="http://example.com/a-1234567890">A 1234567890</a>
Broken: <a href="http://example.com/only-text">Only Text</a>
Fixed: <a href="http://example.com/only-text">Only Text</a>
我已经在https://regex101.com/在线测试了正则表达式,据我所知,它是正确编写的。 (恕我直言,这并不复杂)。
这是一个PHP错误,还是我不完全使用正则表达式?
答案 0 :(得分:2)
为了避免这种行为,只需将$1
更改为${1}
,与$2
相同
foreach( $items as $title => $item ) {
$search = '/(<a href="[^"]+">)[^<]+(<\/a>)/';
$replace = '${1}' . $title . '${2}';
...
答案 1 :(得分:0)
似乎应该怪我的$replace
参数('$1' . $title . '$2'
)。由于$ title以数字开头,因此将其添加到$ 1中,因此$replace
看起来像$11234...$2
。
解决方案:
$replace = '$1%s$2';
.
.
.
echo sprint( $item, $title );
...的优点是不会在页面标题链接中引入虚假空格。