应用错误收集

如何创建Google阅读器？

时间：2010-10-13 00:06:24

标签： php javascript mysql feeds google-reader

我需要为我的大学项目创建一个像Google Reader这样的网络工具。

我有2个问题：

1） Google阅读器如何跟踪已阅读和未阅读的帖子？

2） Google阅读器会保存数据库中的每个帖子或加载Feed吗？

4 个答案:

答案 0 :(得分：3)

将哈希值分配给单个Feed帖子（即数据+ url ??? =哈希以识别单个帖子）
动态加载它们是我的猜测，也许每个用户缓存一个有限的数量。

答案 1 :(得分：2)

＃2：Google有一个名为FeedFetcher的特殊RSS抓取工具。当您请求RSS源时，会调度它以检索它，并将该源存储到由URL标识的全局（所有用户）缓存中。下次请求提要时（即使是不同的用户 - 只要URL匹配），它就会从缓存中加载。

我不确定缓存失效机制是什么，但是爬虫肯定不会像响应的Cache-Control机制那样频繁地重新访问这些源（这可能是一件好事，因为很多生成RSS Feed发送no-cache虽然它们不会经常更改）。但是，这个内部缓存似乎不会持续超过几个小时。

（这些是我之前从我的RSS提要访问日志中提出的假设;我仍然认为它们是有效的，因为我没有看到爬虫行为的任何重大变化）

答案 2 :(得分：2)

不确定它现在是否有所帮助，但是对于其他人来说，我用详细的设计记下了我的想法：

Designing a Scalable Google Reader Clone

答案 3 :(得分：0)

您可以使用 Selfoos 新的多用途RSS阅读器，直播，mashup，聚合Web应用程序。

功能

基于网络的RSS阅读器

通用聚合器

开源和免费

使用开放式插件系统可轻松扩展（编写您自己的数据连接器）

移动支持（Android，iOS，iPad）

使用selfoss直播并收集所有帖子，推文和Feed 在一个地方

轻量级PHP应用程序，小于2 MB

支持MySQL，PostgreSQL和Sqlite数据库

OPML导入

轻松安装：上传并运行

with restful json api

网站：http://selfoss.aditu.de/

GitHub ：https://github.com/SSilence/selfoss