从字符串中提取链接并将它们放入数组然后解析它们

时间:2011-07-09 13:59:32

标签: php regex

我在PHP中有一个小的正则表达式脚本,可以从一个看起来像

的字符串中点击我的所有链接
function clickable_link($text)
{
$text = preg_replace('#(script|about|applet|activex|chrome):#is', "\\1:", $text);
$ret = ' ' . $text;
$ret = preg_replace("#(^|[\n ])([\w]+?://[\w\#$%&~/.\-;:=,?@\[\]+]*)#is", "\\1<a href=\"\\2\" target=\"_blank\" rel=\"nofollow\" id=\"LinkWordWarp\">\\2</a>", $ret);
$ret = preg_replace("#(^|[\n ])((www|ftp)\.[\w\#$%&~/.\-;:=,?@\[\]+]*)#is", "\\1<a href=\"http://\\2\" target=\"_blank\" rel=\"nofollow\" id=\"LinkWordWarp\">\\2</a>", $ret);
$ret = preg_replace("#(^|[\n ])([a-z0-9&\-_.]+?)@([\w\-]+\.([\w\-\.]+\.)*[\w]+)#i", "\\1<a href=\"mailto:\\2@\\3\">\\2@\\3</a>", $ret);

return $ret;
}

并且工作正常,但我想进行一些小调整,比如查看它的YouTube链接何时不能让他成为

<a href=youtube>youtube</a>

而是(如果有youtube链接)

<iframe width="425" height="349" src="http://www.youtube.com/embed/youtube" frameborder="0" allowfullscreen></iframe>

<img src="link" />

如果是图像。

任何帮助都将不胜感激。

我为所有这些写了一个小脚本,但它太慢了!!!!!!!!!

<?php

function MakeContentInteractive($string)
{
    $order   = array("<br>", "<br/>", "<br />");
    $replace = ' <br/> ';
    $string = str_replace($order, $replace, $string);

    $firstImageSetted = false;
    $firstImage = "";
    $allval = "";
    $pieces = explode(" ", $string);
    $regex = "^(((ht|f)tp(s?))\://)?(www.|[a-zA-Z].)[a-zA-Z0-9\-\.]+\.(com|edu|gov|mil|net|org|biz|info|name|museum|us|ca|uk|co|tk)(\:[0-9]+)*(/($|[a-zA-Z0-9\.\,\;\?\'\\\+&amp;%\$#\=~_\-]+))*$^"; // SCHEME

    $i=0;
    foreach($pieces as $val)
    {   
        echo $val."<hr>";
        $i++;
        $url = $val;
        $url = str_replace(" ", "+", $url);
        $strlen = strlen($url);
        $ext = substr($val,$strlen-4,$strlen);
        $random = rand(1000000,9000000);
        if(preg_match($regex, $url))
        {
            /*CHECK IF IS YOUTUBE*/
            $pos = strpos($url,"youtube.com");
            if ($pos !== false) 
            {   
                //retrive video from link
                $videoLink = $val;
                $videoLinkPharser = $videoLink;
                $videoLinkPharser = substr($videoLinkPharser, 2, 42);
                $vid = substr($videoLinkPharser, -11, 42);

                //check if youtube link is valid
                $youtubeId = $vid;
                // Check if youtube video item exists by the existance of the the 200 response
                $headers = get_headers('http://gdata.youtube.com/feeds/api/videos/' . $vid);
                if (!strpos($headers[0], '200')) 
                {
                    $valid = 0;
                }
                else
                {
                    $isYoutube = 1;
                    $valid = 1;
                    $code = '<div id="YoutubeLink"><iframe width="425" height="349" src="http://www.youtube.com/embed/'.$vid.'" frameborder="0" allowfullscreen></iframe></div>';
                    $allval = $allval.$code;
                }

            }



            if(!$isYoutube == 1)
            {
                $url=trim($url);
                /*CHECK IF IS PICTURE*/
                $mime = getimagesize($url);
                $mime = $mime['mime'];

                if($mime == "image/gif" or $mime == "image/jpeg" or $mime == "image/png")
                {

                    echo $url;
                    if(exif_imagetype($url) == IMAGETYPE_GIF and $ext == ".gif")
                    {
                        $isPicture = 1;
                        $filename =$random.basename($url);
                        $code = '<div id="CategoryPicture"><img src="'.$val.'" width="100" height="100" /><div>';
                        $allval = $allval.$code;

                        if($firstImageSetted == false)
                        {
                            $firstImage=$val;
                            $firstImageSetted = true;
                        }

                    }

                    if(exif_imagetype($url) == IMAGETYPE_JPEG and $ext == ".jpg")
                    {
                        $isPicture = 1;
                        $filename =$random.basename($url);
                        $code = '<div id="CategoryPicture"><img src="'.$val.'" width="100" height="100" /><div>';
                        $allval = $allval.$code;

                        if($firstImageSetted == false)
                        {
                            $firstImage=$val;
                            $firstImageSetted = true;
                            echo "JPG!";
                        }
                    }

                    if(exif_imagetype($url) ==  IMAGETYPE_PNG and $ext == ".png")
                    {
                        $isPicture = 1;
                        $filename =$random.basename($url);
                        $code = '<div id="CategoryPicture"><img src="'.$val.'" width="100" height="100" /><div>';
                        $allval = $allval.$code;

                        if($firstImageSetted == false)
                        {
                            $firstImage=$val;
                            $firstImageSetted = true;
                        }
                    }
                }


            }

            /*IF not YOUTUBE or PICTURE then it's a link*/
            if(!$isYoutube == 1 and !$isPicture == 1)
            {

                $text = preg_replace('#(script|about|applet|activex|chrome):#is', "\\1:", $url);
                $ret = ' ' . $text;

                $ret = preg_replace("#(^|[\n ])([\w]+?://[\w\#$%&~/.\-;:=,?@\[\]+]*)#is", "\\1<a href=\"\\2\" target=\"_blank\" rel=\"nofollow\" id=\"LinkWordWarp\">\\2</a>", $ret);
                $ret = preg_replace("#(^|[\n ])((www|ftp)\.[\w\#$%&~/.\-;:=,?@\[\]+]*)#is", "\\1<a href=\"http://\\2\" target=\"_blank\" rel=\"nofollow\" id=\"LinkWordWarp\">\\2</a>", $ret);
                $ret = preg_replace("#(^|[\n ])([a-z0-9&\-_.]+?)@([\w\-]+\.([\w\-\.]+\.)*[\w]+)#i", "\\1<a href=\"mailto:\\2@\\3\">\\2@\\3</a>", $ret);

                $code = '<a href="'.$url.'">'.$url.'</a>';
                $allval = $allval.$ret;

            }


            $isYoutube = 0;
            $isPicture = 0;


        }
        else
        {
            $allval = $allval.$val;
        }

    }

    echo "and the first image is: ".$firstImage."<br/>";
    return $allval;


}
?>

慢的部分是用exif和getimage尺寸检查图像(每张图片3秒!!!)我怎样才能解决这个问题?

1 个答案:

答案 0 :(得分:0)

也许添加

$ret = preg_replace("#http\://www.youtube.com/watch\?v=([a-z0-9-_])+(&feature=[a-z_]*)*#is",
            '<iframe width="425" height="349" src="http://www.youtube.com/embed/\1" frameborder="0" allowfullscreen></iframe>');

表示Youtube和

$ret = preg_replace("#https?\://[a-z0-9\-.]*/[^\s]+((\.jpg)|(\.jpeg)|(\.png)|(\.gif)|(\.bmp))#is",
            '<img src="\0" />');

图片。但是,您最好通过一次调用完成所有替换,以避免替换已经替换的链接。 preg_replace可以将数组作为模式和替换args。

但是,在获得服务器响应之前,您无法确定URL是否链接到图像。您只能建议,如果链接以“.jpg”,“。jpeg”,“。gif”,“。bmp”结尾,那么它可能是图像。但它可以是“http://www.google.com/search?q=trollface.jpg”,以“.jpg”结尾,但不是图像。您可以使用CURL检查此类链接,但这可能是一个生产力问题。

编辑:好的,您的更新代码存在问题。该脚本非常慢,因为您向其他服务器发送请求,并且延迟的主要部分是为其响应而烦恼。首先,我认为当您有http://www.youtube.com/watch?v=blahblah&feature=blah之类的链接时,没有必要检查YouTube上是否存在视频。你可以拿代码blahblah并嵌入它。如果没有这样的视频,那么youtube将告诉我们,这是发布该链接的人的问题。我认为我写的preg_replace就足够了。

其次,您为同一个URL多次调用图像处理函数。每次必须从其他服务器下载图像。您应该只请求服务器一次 - 将图像(或任何响应)下载到临时文件,然后将其路径而不是URL传递给图像函数。