获取文章preg_match和file_get_contents的标题

时间:2014-12-17 18:27:28

标签: php preg-match

我正试图从网站上获取文章的标题。 它适用于某些网站但不适用于所有网站。

我尝试过BBC新闻并且有效。当我尝试使用NYtimes文章时,即使我在源代码中看到标题标签存在正确的标题,它也不会给出好的标题。

这是代码

$titre = preg_match('/<title>(.+)<\/title>/',file_get_contents($url),$matches);
echo $matches[1];

当我尝试http://www.bbc.com/news/business-30512079时,它可以正常工作

当我尝试enter link description here时 它给出了登录 - 纽约时报

1 个答案:

答案 0 :(得分:0)

“纽约时报”使用一个付费登录门,会在一定数量的请求后将您重定向到登录/注册页面。我猜你的刮刀正在打这个付款门。