通过PHP获取网站内容

时间:2011-04-09 23:31:56

标签: php

如何通过PHP获取页面内容?我如何获取博客文章的文本,因为大多数RRS提要仅提供文章的链接,所以我不能使用它。是否存在PHP函数或者无论如何都要执行此操作。请提供一些建议:)。

2 个答案:

答案 0 :(得分:8)

要加载页面,HTML和所有内容,您可以在网址上使用fopen:

$page = file_get_contents('http://www.blog.com/one-example-post');

对于更高级的网页处理,cURL库将更加巧妙地与远程服务器进行交互(例如,如果有HTTP身份验证,或者是https页面)。

一旦你掌握了网页的内容,你可能需要做一些screen scraping(也就是网页抓取)...而且你很幸运,因为我刚刚做了这个另一个项目。 Here's a great library我发现了帮助这种肮脏的技术。祝你好运。

答案 1 :(得分:3)

cURL是一个选项,特别是如果您需要您的应用程序像浏览器一样(例如设置用户代理等)。您还可以使用[file_get_contents](请参阅:http://php.net/manual/en/function.file-get-contents.php),这对于简单的应用程序来说已经足够了。