Question

我的公司正在开始构建基于网络的RSS阅读器，用户可以注册并跟踪供稿;很像Google Reader。

我的第一个想法是，一旦我有某个博客或网站的供稿网址，我只需要轮询一次以获取内容，然后将条目插入数据库以供订阅它的任何人使用。

然而;如果有人使用像FeedBurner这样的服务来跟踪读者统计数据，那么100个读者可以订阅特定的博客或网站，它只会向实际作者显示为1个读者。

每个订阅者轮询一次将是一个巨大的不必要开销，特别是如果有一千个用户订阅了相同的订阅源。您是否有任何建议，或者是唯一能够快速连续多次轮询同一个Feed的解决方案？

Answer 1

据我所知，Google阅读器以这种方式解决了这个问题：他们客户的用户代理字符串包括通过阅读器阅读此Feed的订阅者数量。

我不知道FeedBurner或其他工具是否解释了这一点，但理论上至少可以通过这种方式从http日志文件中获取准确的统计信息。

修改

根据official Google Reader documentation，其Feed提取程序的User-Agent标头如下所示：

User-Agent: Feedfetcher-Google; (+http://www.google.com/feedfetcher.html; 4 subscribers; feed-id=1794595805790851116)

Answer 2

实际上，FeedBurner试图做出明智的猜测。这是一个很好的post关于如何参与良好的读者评估。

你如何建立一个基于网络的RSS阅读器，不会弄乱博客作者的读者统计数据？

2 个答案: