我想找到一个没有target
属性的HTML字符串中的所有链接,以便可以添加它。
以下是一些检测属性的代码...我可以尝试搜索输出以查找是否存在目标但是有一种更简单的方法可以检测它是否具有目标属性?
$content = '<p>This is some <a href="http://www.google.com">sample text</a> with
<a href="htttp://bing.com" target="_blank" class="test">links</a>.</p>';
preg_match_all('/<a([^>]*)href="([^"]*)"([^>]*)>([^<]*)<\/a>/', $content, $matches);
print_r($matches);
输出:
Array
(
[0] => Array
(
[0] => <a href="http://www.google.com">sample text</a>
[1] => <a href="htttp://bing.com" target="_blank" class="test">links</a>
)
[1] => Array
(
[0] =>
[1] =>
)
[2] => Array
(
[0] => http://www.google.com
[1] => htttp://bing.com
)
[3] => Array
(
[0] =>
[1] => target="_blank" class="test"
)
[4] => Array
(
[0] => sample text
[1] => links
)
)
答案 0 :(得分:11)
解决此问题而不是正则表达式的另一种方法是使用php DOM extension,它允许您通过DOM API操作XML文档。 以下是您的示例:
$content = '<p>This is some <a href="http://www.google.com">sample text</a>
with <a href="htttp://bing.com" target="_blank" class="test">links</a>.</p>';
$doc = new DOMDocument();
$doc->loadHTML($content);
$links = $doc->getElementsByTagName('a');
foreach ($links as $item) {
if (!$item->hasAttribute('target'))
$item->setAttribute('target','_blank');
}
$content=$doc->saveHTML();
echo $content;
这更好,而不是使用难以保留和调试的复杂正则表达式。
希望它有所帮助。祝你好运!
答案 1 :(得分:1)
当我解决类似的问题时,我分两步解决了这个问题:
在HTML文档中搜索所有锚标记(就像您一样)
对于每个找到的锚点,我都应用了一个新的正则表达式,旨在列出所有属性。
很容易发现哪些没有指定目标属性。 您可以从步骤n°2开始的有用正则表达式是
(\S+)=["']?((?:.(?!["']?\s+(?:\S+)=|[>"']))+.)["']?
我找到了here
答案 2 :(得分:0)
我不确定php是否支持它,但这个regexp需要第一个A元素:
<a ((?!target)[^>])+?>
在此处找到解决方案/说明https://stackoverflow.com/a/406408/1692632