任何人都知道如何从任何给定的文章页面生成摘录(因此可以从许多类型的网站获取)?类似于Facebook将URL粘贴到帖子中时所执行的操作。谢谢。
答案 0 :(得分:5)
您要做的事情称为web scraping。这样做的基本方法是捕获页面(您可以使用file_get_contents
抓取URL),然后以某种方式解析它以获取您想要的内容(即从<body>
中提取内容标记)。
为了解析返回的HTML,您应该使用DOM解析器。 PHP有自己的DOM classes,你可以使用它。
答案 1 :(得分:1)
以下是有关如何执行此操作的视频教程:
http://net.tutsplus.com/tutorials/php/how-to-create-blog-excerpts-with-php/