来自Feed的最重要的项目,以保存在DB中

时间:2012-08-23 16:17:42

标签: php feed simplepie

我正在构建一个Feed聚合器。我有很多博客地址,我想保存数据库中的所有帖子。我正在使用Simplepie获取feed然后使用php我将它们插入到数据库中。 Simplepie的API非常大,我不知道该帖子的哪些部分应该保存。到目前为止,我正在保存:

  • ID
  • 标题
  • 日期
  • 永久
  • 作者
  • 描述
  • 内容

我想知道我应该在数据库中保存哪些其他内容。我不知道整个API,而且时间很长。

1 个答案:

答案 0 :(得分:0)

你可以采取逆向工程方法。

选择您已有的少量Feed并查看网址来源以查看Feed中的标记。检查几个后,您应该能够确定大多数Feed包含的内容,并决定如何设置数据库。

例如,这是一个Feed网址:

feeds.feedburner.com/webresourcesdepot?format=xml

您可以将其放入浏览器,查看来源,然后找到包含Feed内容的部分,并确定他们拥有的标记。

您还可以浏览RSS规范并查看有效RSS源的所有有效选项。

http://cyber.law.harvard.edu/rss/rss.html