我正在计划一个新的项目,最终将涉及分析我收集的数据。它主要是具有不同数量组件的时间序列数据(想想关系数据库列)。时间序列数据将在所涵盖的时间段和测量的频率上变化(因此没有太多的标准化信息可以组合成更少的表格)。没有时间序列集将具有太多数据,可能每个系列最多约100,000次测量,平均约5000次测量(想想行)。我希望至少有10,000套不同的时间序列数据(思考表)。
我预计不必进行许多复杂的查询(即使我这样做,也没有时间敏感的这个项目,因为它实际上只是批量式分析,所以我可以在选择数据后用软件做复杂的事情DB)所以我也在考虑像MongoDB这样的NoSQL数据库。
有人可以告诉我MySQL或MongoDB是否是更好的选择?如果MySQL,哪个存储引擎?如果不是,你有更好的建议吗?此外,如果表的数量从10,000跳到500,000或更多,这是否会改变您的答案?
答案 0 :(得分:3)
我想建议一个名为SciDB.org的新DBMS。他们声称它不是典型的DBMS,因为它更侧重于科学分析处理。它专门针对时间序列数据进行了优化,并且可以进一步优化以在云上运行。
它针对时间序列数据进行了优化,因为它将数据存储在列中而不是行中,从而允许在时间维度上快速访问。
你应该看看。
我用它来分析在几个月的时间内以每秒2000个样本采样的数据。