Azure上的Rss聚合器 - 最好的方法

时间:2014-04-19 14:06:58

标签: c# azure rss aggregate

我的应用程序(后端)在Windows Azure上运行。应用程序必须读取rss提要,并将信息写入数据库。很多问题,但这些基本。   

1.组织应用程序架构的最佳方式是什么?

  

2.如何从Feed中获取更新(定期请求或使用PubSubHubbub)?

  

3.我怎么知道频道支持PubSubHubbub?

感谢您提供任何信息

1 个答案:

答案 0 :(得分:2)

问题归结为您正在汇总的RSS源,我怀疑您可能拥有支持PuSH的RSS渠道。

如果你是一个大的RSS聚合器,那么我会说你应该同时支持PuSH并获得请求,但是当你很小时,它归结为一件事,你的时间来编码和维护。

如果您有可能使用非PuSH兼容的RSS源,那么我只会说定期更新的代码。如果需要,您可以稍后在PuSH中编码。

在架构方面,它取决于您的可扩展性要求。我个人喜欢这种方法

  1. Azure计划程序>消息到存储队列

    • 这将启动一个流程,确定需要更新RSS源的所有站点。
    • 将需要检查的网站推送到Azure Service Bus
  2. Azure Service Bus>流程(转到站点并更新RSS源)

  3. 将所有这些保留在服务总线上意味着您可以根据需要扩展服务器,并且它们都读取相同的队列,但它会分割工作负载。

    在您的数据库中,保持哪些状态支持PuSH。稍后您可以更改获取这些RSS源的方法,只将那些不支持PuSH的队列放入队列中。