我正在使用Curl像这样刮Youtube:
<?php
$url = "http://www.youtube.com/watch?v=RnpyRe_7jZA";
$ch = curl_init($url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$curl_scraped_page = curl_exec($ch);
curl_close($ch);
$curl_scraped_page = preg_replace("#(<\s*a\s+[^>]*href\s*=\s*[\"'])(?!http)([^\"'>]+)([\"'>]+)#",'$1http://www.youtube.com$2$3', $curl_scraped_page);
echo $curl_scraped_page;
?>
这将加载页面,但它不会播放youtube视频(给我错误)。我该怎么做才能玩呢?我用谷歌搜索,但没有太多关于这个问题的信息。
当我点击播放按钮时,这是我在控制台中看到的一部分:
GET http://r1---sn-5hn7zn7r.c.youtube.com/videoplayback?algorithm=throttle-fact…r%2Cid%2Cip%2Cipbits%2Citag%2Csource%2Cupn%2Cexpire&sver=3&upn=CKRxxB49gXE 403 (Forbidden) www-watch-extra-vflTE8ErJ.js:85
GET http://tc.v21.cache3.c.youtube.com/videoplayback?algorithm=throttle-factor&…r%2Cid%2Cip%2Cipbits%2Citag%2Csource%2Cupn%2Cexpire&sver=3&upn=CKRxxB49gXE 403 (Forbidden) tc.v21.cache3.c.youtube.com/videoplayback?algorithm=throttle-factor&burst=4…2Cid%2Cip%2Cipbits%2Citag%2Csource%2Cupn%2Cexpire&sver=3&upn=CKRxxB49gXE:1
GET http://r1---sn-5hn7zn7r.c.youtube.com/videoplayback?algorithm=throttle-fact…ver=3&upn=CKRxxB49gXE&ptchn=NickiMinajAtVEVO&ptk=vevo&cpn=uXm1XYfZqNkRDPGT 403 (Forbidden) r1---sn-5hn7zn7r.c.youtube.com/videoplayback?algorithm=throttle-factor&burs…r=3&upn=CKRxxB49gXE&ptchn=NickiMinajAtVEVO&ptk=vevo&cpn=uXm1XYfZqNkRDPGT:1
GET http://tc.v21.cache3.c.youtube.com/videoplayback?algorithm=throttle-factor&…RxxB49gXE&ptchn=NickiMinajAtVEVO&playretry=1&ptk=vevo&cpn=uXm1XYfZqNkRDPGT 403 (Forbidden) tc.v21.cache3.c.youtube.com/videoplayback?algorithm=throttle-factor&burst=4…xB49gXE&ptchn=NickiMinajAtVEVO&playretry=1&ptk=vevo&cpn=uXm1XYfZqNkRDPGT:1
答案 0 :(得分:1)
如果查看控制台,您会看到服务器响应403错误。这意味着&#34;访问被禁止&#34;。可能YouTube不希望服务器(机器人)下载他们的网站。您可以将HTTP标头修改为普通浏览器,例如在php中:
header("User-Agent: Mozilla/5.0 Macintosh; Intel Mac OS X 10.8; rv:19.0) Gecko/20100101
Firefox/19.0");
我注意到它依赖于服务器配置。虽然它可能不适用于你的,但我在我的测试服务器上进行了测试,但它确实有效。
它发送的标题是:
194.166.35.216 - - [07/Apr/2013:13:36:39 +0200] "GET / HTTP/1.1" 200 2739 "-" "-"
对不起,如果我帮不了你。