使用打开的图形和卷曲来刮取新页面

时间:2013-02-22 02:30:48

标签: facebook curl scrape

我正在开发一个网站,我在其中创建了一个博客,在该博客上,人们可以通过他们的Facebook发表评论。现在我注意到,每当我创建一个新博客时,评论插件会显示警告“网址无法访问”。

我已经发现摆脱这个警告的方法是刮掉新博客。

如果我在命令行上使用以下查询:

curl -F "id=http://www.maartenvangenechten.be/blog/post/13/" -F "scrape=true" -k https://graph.facebook.com

警告消失,但从长远来看,这不是最好的方法。我输出的元数据中输出的所有数据都会输出,告诉我该页面已被成功删除

所以我尝试使用php / libcurl:

$params = array(
"id"=>$url,
"scrape"=>"true");

$ch = curl_init("https://graph.facebook.com");
curl_setopt_array($ch, array(
  CURLOPT_RETURNTRANSFER=>true,
  CURLOPT_SSL_VERIFYHOST=>false,
  CURLOPT_SSL_VERIFYPEER=>false,
  CURLOPT_POST=>true,
  CURLOPT_POSTFIELDS=>$params
));
$result = curl_exec($ch);
curl_close($ch);
echo $result;

现在这只输出:

{"id":"214022612077699","url":"http:\/\/www.maartenvangenechten.be\/blog\/post\/13\/"}

而不是

{"url":"http:\/\/www.maartenvangenechten.be\/","type":"website","title":"Maartens Homepage","image":[{"url":"http:\/\/www.maartenvangenechten.be\/images\/general\/logo_enlighten.gif"}],"description":"Hier kan je alles vinden over mijn huidige projecten. Bekijk ook zeker de blog, waar ik de verschillende uitdagingen die ik tegenkom zal toelichten","site_name":"VangenechtenDESIGNs","admins":[{"id":"591822147","name":"Maarten Van Genechten","url":"http:\/\/www.facebook.com\/exquisitje"}],"updated_time":"2013-02-22T02:27:18+0000","id":"492686967461912","application":{"id":"482576148470885","name":"MVGPortfolio","url":"http:\/\/www.facebook.com\/apps\/application.php?id=482576148470885"}}

正如我所料

无法找到原因

1 个答案:

答案 0 :(得分:1)

好的,在网上搜索了几个小时后解决了......

我在不同的浏览器上试过这个功能,Opera,Firefox甚至IE都返回了预期的结果,只有Chrome给出了问题...

清除了缓存,历史记录以及通过Chrome存储的所有其他内容,问题就消失了。