如何使用drupal等cms系统进行爬行?

时间:2009-10-29 08:18:15

标签: php drupal content-management-system customization

我希望自己显示数据,

使用cms仅抓取数据。

任何人都可以分享经验并给我一些关于入口点的线索吗?

1 个答案:

答案 0 :(得分:3)

我将重新解释这个问题:“我如何使用Drupal创建和聚合内容,但是通过HTML网页以外的方式显示它?”

答案是专注于生成XML提要。在Drupal Core中,默认rss feed位于/rss.xml。每个分类列表页面也都有一个与之关联的RSS源。要进一步扩展这些选项,请使用Views中的RSS提要显示,Views Datasource模块以添加更多种类的数据(例如JSON输出),甚至是RDF项目想要走在最前沿。

如果您不希望将这些内容显示为HTML,请在Drupal中生成的几乎每个页面上使用hook_menu_alter() - 运行每个节点并阻止它。那时候,这个问题就变成了一种学术问题,因为如果你对主题图层不感兴趣,那么任何CMS都是错误的工具。