将nosql数据库用于非常大的数据集,其数据大小较小且写入较为适中

时间:2013-08-13 00:39:31

标签: java mongodb riak nosql

什么是更好的nosql数据库,用于创建系统来记录每天大约50到2亿次插入的广告数据,数据的聚合将用于显示用户如何与广告互动的模式。我真的很喜欢MongoDB,但似乎主要的行业参与者正在选择Riak来完成这项工作。似乎Mongo不得不在最近的两个版本中提出一些注意事项,当前的版本似乎对这项工作非常好,任何想法?

3 个答案:

答案 0 :(得分:1)

似乎mongodb with hadoop(http://docs.mongodb.org/ecosystem/tutorial/getting-started-with-hadoop/)符合您的数据要求。您可以在mongodb中存储数据并在hadoop集群上运行聚合作业(map / reduce)。

答案 1 :(得分:0)

我将使用Oracle的Java Berkeley DB。

非常强大且易于使用开源但不是免费的。

答案 2 :(得分:0)

这不是一种可以作为Product1Product2回答的问题。提供的信息量太少。没有关于环境的信息,系统将在哪里运行,将插入什么类型的信息,您将如何聚合它。

最好的方法是尝试:

  1. 使用Product1
  2. 编写测试
  3. Product2
  4. 写同样的东西
  5. 开始插入尽可能接近的数据 您假定进入真实环境的数据
  6. 测量速度和您需要的任何因素
  7. 并且仅基于此,您将能够确定适合您的内容