PHP中的正则表达式/找到“<a> </a>”

时间:2017-04-21 21:48:50

标签: php html regex hyperlink

我想检查textarea。如果用户在textarea中输入一些链接,php应该自动标记链接。我正在使用此代码:

    $message = "text with some link within"; 

    $url = '@(?!<a[^>]*?>)(http)?(s)?(://)?(([a-zA-Z])([-\w]+\.)+([^\s\.]+[^\s]*)+[^,.\s])(?![^<]*?</a>)@';


    if(preg_match($url, $message) == 1){

    $message = preg_replace($url, '<a href="http$2://$4" target="_blank" rel="nofollow" title="$0">$0</a>', $message);

    }

问题是,当已经有标记链接(带有“a”标记)时,正则表达式正在破坏链接。

以下是一个例子:

来自textarea的第一个输入:Hello .... test.com

由正则表达式更改:Hello ... <a href="http://test.com" target="_blank" rel="nofollow" title="test.com">test.com</a>

这工作正常,但是如果你更新它:

Hello ... http://test.com" target="_blank" rel="nofollow" title="test.com" target="_blank" rel="nofollow" title="test.com">test.com">test.com">test.com

感谢您的帮助!

1 个答案:

答案 0 :(得分:0)

我不熟悉PHP,也许这不是一个很好的url验证模式,但关键是如果已经有一个“a”标签,那么文本就不会被替换。

<?php

    $message = array(
        'Hello ... <a href="http://test.com" target="_blank" rel="nofollow" title="test.com">test.com</a>',
        "Hello .... http://www.test.com ..."
    );

    $url = '@(<a[^>]*>[^<]+</a>|((https?://)?[\w\.-]+\.[a-zA-Z]{2,3}[^\s\W]*))@';

    foreach ($message as $msg) {

        preg_match($url, $msg, $matches);

        if(preg_match($url, $msg) == 1 && count($matches) > 2) {

            $msg = preg_replace($url, '<a href="$0" target="_blank" rel="nofollow" title="$0">$0</a>', $msg);

        }

        echo $msg.PHP_EOL;

    }

    // Output:
    // Hello ... <a href="http://test.com" target="_blank" rel="nofollow" title="test.com">test.com</a>
    // Hello .... <a href="http://www.test.com" target="_blank" rel="nofollow" title="http://www.test.com">http://www.test.com</a> ...

希望它有所帮助。