我正试图从网站上获取文章的标题。 它适用于某些网站但不适用于所有网站。
我尝试过BBC新闻并且有效。当我尝试使用NYtimes文章时,即使我在源代码中看到标题标签存在正确的标题,它也不会给出好的标题。
这是代码
$titre = preg_match('/<title>(.+)<\/title>/',file_get_contents($url),$matches);
echo $matches[1];
当我尝试http://www.bbc.com/news/business-30512079时,它可以正常工作
当我尝试enter link description here时 它给出了登录 - 纽约时报
答案 0 :(得分:0)
“纽约时报”使用一个付费登录门,会在一定数量的请求后将您重定向到登录/注册页面。我猜你的刮刀正在打这个付款门。