你如何建立一个基于网络的RSS阅读器,不会弄乱博客作者的读者统计数据?

时间:2009-02-10 14:20:32

标签: methods rss

我的公司正在开始构建基于网络的RSS阅读器,用户可以注册并跟踪供稿;很像Google Reader。

我的第一个想法是,一旦我有某个博客或网站的供稿网址,我只需要轮询一次以获取内容,然后将条目插入数据库以供订阅它的任何人使用。

然而;如果有人使用像FeedBurner这样的服务来跟踪读者统计数据,那么100个读者可以订阅特定的博客或网站,它只会向实际作者显示为1个读者。

每个订阅者轮询一次将是一个巨大的不必要开销,特别是如果有一千个用户订阅了相同的订阅源。您是否有任何建议,或者是唯一能够快速连续多次轮询同一个Feed的解决方案?

2 个答案:

答案 0 :(得分:10)

据我所知,Google阅读器以这种方式解决了这个问题:他们客户的用户代理字符串包括通过阅读器阅读此Feed的订阅者数量。

我不知道FeedBurner或其他工具是否解释了这一点,但理论上至少可以通过这种方式从http日志文件中获取准确的统计信息。

修改

根据official Google Reader documentation,其Feed提取程序的User-Agent标头如下所示:

User-Agent: Feedfetcher-Google; (+http://www.google.com/feedfetcher.html; 4 subscribers; feed-id=1794595805790851116)

答案 1 :(得分:0)

实际上,FeedBurner试图做出明智的猜测。这是一个很好的post关于如何参与良好的读者评估。