PHP提取文章摘录自页面

时间:2010-08-10 15:43:16

标签: php facebook

任何人都知道如何从任何给定的文章页面生成摘录(因此可以从许多类型的网站获取)?类似于Facebook将URL粘贴到帖子中时所执行的操作。谢谢。

2 个答案:

答案 0 :(得分:5)

您要做的事情称为web scraping。这样做的基本方法是捕获页面(您可以使用file_get_contents抓取URL),然后以某种方式解析它以获取您想要的内容(即从<body>中提取内容标记)。

为了解析返回的HTML,您应该使用DOM解析器。 PHP有自己的DOM classes,你可以使用它。

答案 1 :(得分:1)

以下是有关如何执行此操作的视频教程:

http://net.tutsplus.com/tutorials/php/how-to-create-blog-excerpts-with-php/