我正在开展一个项目,要求我将各种网站的多个Feed聚合到本地/可搜索的数据库中。项目/站点是基于Drupal的,旧的feed条目是项目的关键数据。我的问题是:
感谢。
答案 0 :(得分:3)
Drupal中的Drupals feed聚合器模块是执行此操作的官方方式。
在设置中有一个选择标记'丢弃早于以下的项目:'这最多只能持续6周,但可以使用以下方法在自定义模块中覆盖:
function MYMODULE_form_aggregator_admin_settings_alter(&$form, &$form_state) {
$form['aggregator_clear']['#options'][157784630] = "Nearly Never aka 5 years";
}
如上所述here
这将自动为您抓取您的Feed并将其存储在aggregator_item表
中答案 1 :(得分:2)
另一个选项是成熟的http://drupal.org/project/feedapi或更新的http://drupal.org/project/feeds,它们都是为解析drupal节点,用户等的提要而设计的。
Feeds(下一代feedapi)具有以下有用功能:
将数据导入或汇总为节点, 用户,分类术语或简单 数据库记录。
* One-off imports and periodic aggregation of content * Import or aggregate RSS/Atom feeds * Import or aggregate CSV files * Import or aggregate OPML files * PubSubHubbub support * Create nodes, users, taxonomy terms or simple database records from import * Extensible to import any other kind of content * Granular mapping of input elements to Drupal content elements * Exportable configurations * Batched import for large files
祝你好运!