使用正则表达式在PHP下载Youtube视频

时间:2012-01-23 19:06:30

标签: php regex curl download youtube

我正在使用以下代码下载YouTube视频。

    <?php
header("Cache-Control: no-cache, must-revalidate"); // HTTP/1.1
header("Expires: Sat, 26 Jul 1997 05:00:00 GMT"); // Date in the past

require_once('lib/youtube.lib.php');



if(preg_match('/youtube\.com/i',$_GET['url'])){

    if(!preg_match('/www\./i',$_GET['url'])){
        $_GET['url'] = str_replace('http://','http://www.',$_GET['url']);
    }
    list($video_id,$download_link) = get_youtube($_GET['url']);}

else{
    die('<span style="color:red;">Sorry, the URL is not recognized..</span>');
}

    ?>


    <p>
    <img src="http://img.youtube.com/vi/<?php echo trim($video_id);?>/1.jpg" alt="Preview 1" class="ythumb" />
    <img src="http://img.youtube.com/vi/<?php echo trim($video_id);?>/2.jpg" alt="Preview 2" class="ythumb" />
    <img src="http://img.youtube.com/vi/<?php echo trim($video_id);?>/3.jpg" alt="Preview 3" class="ythumb" />
    </p>
    <p>
    <a href="<?php echo trim($download_link);?>" class="ydl" title="Download as FLV">Download FLV</a>
    <a href="<?php echo trim($download_link);?>&fmt=35" class="ydl" title="Download as MP4">Download MP4</a>
    <a href="<?php echo trim($download_link);?>&fmt=17" class="ydl" title="Download as 3GP">Download 3GP</a>
    </p>

我的ge_youtube函数包含在youtube.lib.php文件中。该文件包含代码..

     <?php



function get_content_of_url($url){
    $ohyeah = curl_init();
    curl_setopt($ohyeah, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ohyeah, CURLOPT_URL, $url);
    $data = curl_exec($ohyeah);
    curl_close($ohyeah);
    //print_r($data);
    return $data;
}


function get_flv_link($string) {  
if (preg_match('/watch_fullscreen(.*)plid/i', $string, $out)){


    if (!preg_match('/watch_fullscreen(.*)plid/i', $data, $out)) {  
    $outdata = $out[1];
      echo '1'.'<br>';
    $arrs = (explode('&',$outdata));
    foreach($arrs as $arr){
        list($i,$x) = explode("=",$arr);
        $$i = $x;
    }
    $link = 'http://www.youtube.com/get_video?video_id='.$video_id.'&t='.$t;
    echo '2';
    echo $link;
array($video_id,$link);
    return array($video_id,$link);
} 
}
}

function get_youtube($url){

    $stream = get_content_of_url($url);
 return get_flv_link($stream);
}



?>

输出对我来说非常有趣。输出中没有显示错误。但我仍然可以得到什么。在代码中

> <a href="<?php echo trim($download_link);?>&fmt=17" class="ydl"
> title="Download as 3GP">Download 3GP</a>

显示在结果中,但链接指向localhost。

似乎我错过了一些技巧。让我告诉你我在尝试学习php和卷曲时发现了这个脚本.. 你的任何建议或帮助??你能帮我把这段代码转换成一个有效的代码吗?

感谢

1 个答案:

答案 0 :(得分:1)

问题不在于正则表达式,问题在于图书馆制作的YouTube页面格式的假设。替换:

}

function get_youtube($url){

    else { echo "No match"; }
}

function get_youtube($url){

(将else添加到if中的get_flv_link(),您会收到一条消息,指出内容不匹配。这可能意味着YouTube已经改变了他们的页面格式(可能是因为人们试图像这样刮掉它)。

另外,我很困惑:

if (preg_match('/watch_fullscreen(.*)plid/i', $string, $out)){
    if (!preg_match('/watch_fullscreen(.*)plid/i', $data, $out)) {

那说“如果它匹配,那么检查它是否与另一个变量不匹配(此时尚未声明)”。即使页面内容与预期内容匹配,您也可能需要在库中修复其他位。