我正在尝试计算Facebook上的热门帖子 - DynamoDB是最好的还是适合用途?

时间:2016-05-31 21:37:23

标签: mongodb amazon-web-services amazon-dynamodb database

我目前正在将数据推送到AWS DynamoDB,并最终希望对其进行一些分析。

我真正想要做的就是刮掉Facebook的API,然后使用帖子的post_id设置主键(即https://www.facebook.com/ 1110933312276344 )来存储帖子,喜欢,分享等等。 / p>

那么也许更难的部分是进行某种计算以了解什么是趋势。课程的计算/分析将是自动化的。

我可以轻松下载,存储部分但不确定计算 - DynamoDB会是最好的吗?

理想情况下,我想要做的是从Facebook的图谱API下载后期数据,然后如果帖子在特定时间段内超过一定数量的股票,它将被标记为“趋势”文章。最终结果将是一个API端点,它将列出所有趋势文章。

最终结果可能是所有趋势文章的API端点JSON。

或者我应该考虑其他解决方案?也许MongDB?

1 个答案:

答案 0 :(得分:-1)

为了切断追逐,我个人不会在你的情况下使用Dynamo,特别是如果你是一个小网站,否则可以由SQL商店提供充分的服务。

I've written an implementation of Dynamo paper以及使用亚马逊的规范产品,所以我在这里强调范式而不是语用。

Dynamo或类似发电机的产品的好处是非常大量成本,听起来你无法从中受益。确保对此类应用程序进行一致的读取或写入并不能有效地利用您的时间。另一方面,调低你的N,R和W,为你留下一个低功耗的memcache实例。

有数十个,也许数百个哈希键控数据存储可用,而今天传统的关系数据库也越来越多地提供这些类型的接口。如果您预见到任何未来的后端计算或结果过滤 - 请保存应用程序逻辑并让关系SQL数据库为您处理。

您现在可以在亚马逊面前获得一些营销文献,其中一些表明切换到Dynamo可以让您高枕无忧,或者在技术复杂性方面获得更多模糊的收获。亚马逊(截至2015年初)没有发布其后备存储的详细信息,但基于历史上Dynamo系统的性能,我没有理由相信它只是旋转磁盘 - 如果你运行一个发电机启发的数据库你自己,存储库的问题将出现十倍。