我的公司正在开始构建基于网络的RSS阅读器,用户可以注册并跟踪供稿;很像Google Reader。
我的第一个想法是,一旦我有某个博客或网站的供稿网址,我只需要轮询一次以获取内容,然后将条目插入数据库以供订阅它的任何人使用。
然而;如果有人使用像FeedBurner这样的服务来跟踪读者统计数据,那么100个读者可以订阅特定的博客或网站,它只会向实际作者显示为1个读者。
每个订阅者轮询一次将是一个巨大的不必要开销,特别是如果有一千个用户订阅了相同的订阅源。您是否有任何建议,或者是唯一能够快速连续多次轮询同一个Feed的解决方案?
答案 0 :(得分:10)
据我所知,Google阅读器以这种方式解决了这个问题:他们客户的用户代理字符串包括通过阅读器阅读此Feed的订阅者数量。
我不知道FeedBurner或其他工具是否解释了这一点,但理论上至少可以通过这种方式从http日志文件中获取准确的统计信息。
修改强>
根据official Google Reader documentation,其Feed提取程序的User-Agent标头如下所示:
User-Agent: Feedfetcher-Google; (+http://www.google.com/feedfetcher.html; 4 subscribers; feed-id=1794595805790851116)
答案 1 :(得分:0)
实际上,FeedBurner试图做出明智的猜测。这是一个很好的post关于如何参与良好的读者评估。