PHP - BBCode解析器 - 解析bbcode链接标记和未标记的链接

时间:2010-07-09 19:27:07

标签: php regex preg-replace bbcode

我需要这样做:

当用户插入BBCode标签时,使用preg_replace和regex进行一些转换。

e.g。

function forumBBCode($str){
   $format_search=array(
      '#\[url=(.*?)\](.*?)\[/url\]#i'
   );

   $format_replace=array(
      '<a class="lforum" target="_blank" href="$1">$2</a>'
   );

   $str=preg_replace($format_search, $format_replace, $str);
   $str=nl2br($str);
   return $str;
}

现在我也想要这样:当用户插入带链接的普通文本时,也必须进行转换。我不能这样做preg_replace函数,因为如果我写一个代码

$format_search
'#(www\..*?)#i'

$format_replace
'<a class="lforum" target="_blank" href="$1">$1</a>'

它会将链接转换为2次(在[url]中,当链接没有此标记时)。

所以我想到这个功能:

    function checkLinks($string) {
    $arrelab="";
    $arr=split(' |\r\n', $string);
    for($i=0; $i<sizeof($arr); $i++) {
        echo $i." - ".$arr[$i]."<br/>";
        if ((strpos($arr[$i], 'www.')!==false) or (strpos($arr[$i], 'http://')!==false) or (strpos($arr[$i], 'ftp://')!==false)) {
            if (strpos($arr[$i], '[url=')===false) {
                $arr[$i]='<a class="lforum" target="_blank" href="'.$arr[$i].'">'.$arr[$i].'</a>';
            }
        }

        $arrelab=$arrelab." ".$arr[$i];
    }
    return $arrelab;
}

问题是我需要对换行符进行拆分,就像空行空间一样。 任何帮助将不胜感激。

P.S。抱歉我的英语不好:)

欢呼声

4 个答案:

答案 0 :(得分:2)

最简单的选择是首先解析纯文本网址,并确保它们在等号后不会立即出现。

来自Marios的更新:

preg_replace('#(?<![>/"])(((http|https|ftp)://)?www[a-zA-Z0-9\-_\.]+)#im', '<a href="$1">$1</a>'

答案 1 :(得分:2)

使用lookbehind断言很容易解决。

preg_replace('#(?<![>/"])((http://)?www.........)#im', '<a href="$1">$1</a>'

因此,正则表达式将跳过包含在“或”或“/”之前的任何URL 这是一种解决方法,而不是解决方案。

PS:target =“_ blank”是用户纠缠。把它剪掉。

答案 2 :(得分:1)

您的问题可以通过阅读您的标题来识别.. 解析正则表达式

你不能用正则表达式'解析'html或bb-code,因为它们不是常规语言。

你应该编写(或找到)bb代码解析器,而不是使用正则表达式。

Google对BB代码解析器的第一个结果是NBBC: The New BBCode Parser。但是我从来没有使用它,所以我无法对质量发表评论。

答案 3 :(得分:1)

有一种更简单的方法可以做到这一点。我在RedBonzai开发者博客中创建了一个步骤。它的链接在这里:http://www.redbonzai.com/blog/web-development/how-to-create-a-bb-codes-function-in-php/

如果您有任何疑问,请与我们联系。

RedBonzai