使用preg_match可以具有相同的模式并具有不同的替换?

时间:2019-04-13 11:12:22

标签: php regex preg-replace preg-match str-replace

我创建此模式

$pattern = "/<a href='(?<href>.+?)'>(?<name>.+?)<\/a>/i";

我有这个例子,

$string = "<a href='https://www.php.net/'>https://www.php.net/</a> 
<a href='https://stackoverflow.com/'>https://stackoverflow.com/</a> 
<a href='https://www.google.com/'>https://www.google.com/</a>";

使用它,我可以找到匹配项并提取href和名称。

preg_match_all($pattern, $string, $matches);

Array
(
    [0] => Array
        (
            [0] => https://www.php.net/
            [1] => https://stackoverflow.com/
            [2] => https://www.google.com/
        )

    [href] => Array
        (
            [0] => https://www.php.net/
            [1] => https://stackoverflow.com/
            [2] => https://www.google.com/
        )

    [1] => Array
        (
            [0] => https://www.php.net/
            [1] => https://stackoverflow.com/
            [2] => https://www.google.com/
        )

    [name] => Array
        (
            [0] => https://www.php.net/
            [1] => https://stackoverflow.com/
            [2] => https://www.google.com/
        )

    [2] => Array
        (
            [0] => https://www.php.net/
            [1] => https://stackoverflow.com/
            [2] => https://www.google.com/
        )

)

问题是,当我使用preg_replace时,由于模式相同,因此它会为所有URL更改相同的信息,而我只需要更改名称并相应地保留其余信息。

使用

if(preg_match_all($pattern, $string, $matches))
{
    $string = preg_replace($pattern, "<a href='$1'>Name</a>", $string);

}

我可以从组中获取结果,并保留href的第一部分。但是,如果我尝试更改名称,则所有结果都相同。

如果我尝试使用“ str_replace”,则可以得到预期的不同结果,但这给了我2个问题。一种是,如果我尝试替换名称,那么我也会更改href,并且如果我的URL带有类似的“更多斜杠”,它将更改匹配部分,并保留其余信息。

在数据库中,我具有带有名称列的URL列表,如果字符串与表中的任何行匹配,则需要相应地更改名称并保留href。

有帮助吗?

谢谢。

亲切的问候!

1 个答案:

答案 0 :(得分:0)

我假设您从数据库中以如下格式检索行:

$rows = [
  ['href' => 'https://www.php.net/', 'name' => 'PHP.net'],
  ['href' => 'https://stackoverflow.com/', 'name' => 'Stack Overflow'],
  ['href' => 'https://www.google.com/', 'name' => 'Google']
];

首先,您可以使用循环或array_reduce创建一个href->名称映射:

$rows_by_href = array_reduce($rows, function ($rows_by_href, $row) {
  $rows_by_href[$row['href']] = $row['name'];
  return $rows_by_href;
}, []);

然后,您可以使用preg_replace_callback将每个匹配项替换为其关联的名称(如果存在):

$result = preg_replace_callback($pattern, function ($matches) use ($rows_by_href) {
  return "<a href='" . $matches['href'] . "'>" 
    . ($rows_by_href[$matches['href']] ?? $matches['name']) 
    . "</a>";
}, $string);

echo $result;

演示:https://3v4l.org/IY6p0

请注意,这假设$string中的URL(href)的格式与来自数据库的URL完全相同。否则,您可以rtrim末尾的斜杠或执行其他任何需要做的事情。

还请注意,如果可以避免的话,用正则表达式解析HTML通常不是一个好主意。 DOM分析器更为合适,除非您必须分析来自评论或论坛帖子或您无法控制的内容的字符串。