我需要一些帮助来决定我们应该为项目选择哪个数据库。我们正在开发一个Web应用程序,用于收集有关用户行为的数据并对其进行分析(不好的解释,但我无法提供更多详细信息; Web分析数据是我们的核心数据集之一)。我们估计我们每周会将大约2亿行插入数据库+根据原始数据计算的数据。数据必须保留至少六个月。
上周我花了一半时间收集有关不同解决方案的信息,但似乎有很多我觉得迷失了。我找到的最有希望的是Cassandra,Hbase和Hive。我还看了MongoDb,Redis和其他一些人,但看起来他们看起来很适合不同的需求,或者社区不那么活跃。
我也在使用MySql(因为我们会将其用于所有用户信息等),但是未来扩展会更加困难,我认为在某些时候我们不得不转移到其他数据库。我们也非常愿意投入一些时间和精力来推动所选数据库的发展。
答案 0 :(得分:3)
我们决定继续使用Hadoop(& Hive / Hbase)作为我们的主要数据存储。主要原因是: