我创建此模式
$pattern = "/<a href='(?<href>.+?)'>(?<name>.+?)<\/a>/i";
我有这个例子,
$string = "<a href='https://www.php.net/'>https://www.php.net/</a>
<a href='https://stackoverflow.com/'>https://stackoverflow.com/</a>
<a href='https://www.google.com/'>https://www.google.com/</a>";
使用它,我可以找到匹配项并提取href和名称。
preg_match_all($pattern, $string, $matches);
Array
(
[0] => Array
(
[0] => https://www.php.net/
[1] => https://stackoverflow.com/
[2] => https://www.google.com/
)
[href] => Array
(
[0] => https://www.php.net/
[1] => https://stackoverflow.com/
[2] => https://www.google.com/
)
[1] => Array
(
[0] => https://www.php.net/
[1] => https://stackoverflow.com/
[2] => https://www.google.com/
)
[name] => Array
(
[0] => https://www.php.net/
[1] => https://stackoverflow.com/
[2] => https://www.google.com/
)
[2] => Array
(
[0] => https://www.php.net/
[1] => https://stackoverflow.com/
[2] => https://www.google.com/
)
)
问题是,当我使用preg_replace时,由于模式相同,因此它会为所有URL更改相同的信息,而我只需要更改名称并相应地保留其余信息。
使用
if(preg_match_all($pattern, $string, $matches))
{
$string = preg_replace($pattern, "<a href='$1'>Name</a>", $string);
}
我可以从组中获取结果,并保留href的第一部分。但是,如果我尝试更改名称,则所有结果都相同。
如果我尝试使用“ str_replace”,则可以得到预期的不同结果,但这给了我2个问题。一种是,如果我尝试替换名称,那么我也会更改href,并且如果我的URL带有类似的“更多斜杠”,它将更改匹配部分,并保留其余信息。
在数据库中,我具有带有名称列的URL列表,如果字符串与表中的任何行匹配,则需要相应地更改名称并保留href。
有帮助吗?
谢谢。
亲切的问候!
答案 0 :(得分:0)
我假设您从数据库中以如下格式检索行:
$rows = [
['href' => 'https://www.php.net/', 'name' => 'PHP.net'],
['href' => 'https://stackoverflow.com/', 'name' => 'Stack Overflow'],
['href' => 'https://www.google.com/', 'name' => 'Google']
];
首先,您可以使用循环或array_reduce
创建一个href->名称映射:
$rows_by_href = array_reduce($rows, function ($rows_by_href, $row) {
$rows_by_href[$row['href']] = $row['name'];
return $rows_by_href;
}, []);
然后,您可以使用preg_replace_callback
将每个匹配项替换为其关联的名称(如果存在):
$result = preg_replace_callback($pattern, function ($matches) use ($rows_by_href) {
return "<a href='" . $matches['href'] . "'>"
. ($rows_by_href[$matches['href']] ?? $matches['name'])
. "</a>";
}, $string);
echo $result;
请注意,这假设$string
中的URL(href)的格式与来自数据库的URL完全相同。否则,您可以rtrim
末尾的斜杠或执行其他任何需要做的事情。
还请注意,如果可以避免的话,用正则表达式解析HTML通常不是一个好主意。 DOM分析器更为合适,除非您必须分析来自评论或论坛帖子或您无法控制的内容的字符串。