如何创建Google阅读器?

时间:2010-10-13 00:06:24

标签: php javascript mysql feeds google-reader

我需要为我的大学项目创建一个像Google Reader这样的网络工具。

我有2个问题:

1) Google阅读器如何跟踪已阅读和未阅读的帖子?

2) Google阅读器会保存数据库中的每个帖子或加载Feed吗?

4 个答案:

答案 0 :(得分:3)

  1. 将哈希值分配给单个Feed帖子(即数据+ url ??? =哈希以识别单个帖子)
  2. 动态加载它们是我的猜测,也许每个用户缓存一个有限的数量。

答案 1 :(得分:2)

#2:Google有一个名为FeedFetcher的特殊RSS抓取工具。当您请求RSS源时,会调度它以检索它,并将该源存储到由URL标识的全局(所有用户)缓存中。下次请求提要时(即使是不同的用户 - 只要URL匹配),它就会从缓存中加载。

我不确定缓存失效机制是什么,但是爬虫肯定不会像响应的Cache-Control机制那样频繁地重新访问这些源(这可能是一件好事,因为很多生成RSS Feed发送no-cache虽然它们不会经常更改)。但是,这个内部缓存似乎不会持续超过几个小时。

(这些是我之前从我的RSS提要访问日志中提出的假设;我仍然认为它们是有效的,因为我没有看到爬虫行为的任何重大变化)

答案 2 :(得分:2)

不确定它现在是否有所帮助,但是对于其他人来说,我用详细的设计记下了我的想法:

Designing a Scalable Google Reader Clone

答案 3 :(得分:0)

您可以使用 Selfoos 新的多用途RSS阅读器,直播,mashup,聚合Web应用程序。

功能

  • 基于网络的RSS阅读器
  • 通用聚合器
  • 开源和免费
  • 使用开放式插件系统可轻松扩展(编写您自己的数据 连接器)
  • 移动支持(Android,iOS,iPad)
  • 使用selfoss直播并收集所有帖子,推文和Feed 在一个地方
  • 轻量级PHP应用程序,小于2 MB
  • 支持MySQL,PostgreSQL和Sqlite数据库
  • OPML导入
  • 轻松安装:上传并运行
  • with restful json api

网站http://selfoss.aditu.de/

GitHub https://github.com/SSilence/selfoss