所以这是一个很酷的东西,这些NoSQL数据库。所以有我的数据:一排排的气象数据行:值,表示某个站点的某些测量值(由WMO编号识别,而不是坐标),在某个时间。
并非每个站都测量每个参数,并非每个参数都是一直测量的。
我存储了目前在MySQL中的这些数据(价值30年的小时值,产生约10亿个值)。持续增长和可预见的更多数据的添加让我有点头疼。
阅读基于NoSQL系统的文档似乎相当容易扩展,我想知道NoSQL是否也是气象数据的可行数据存储概念。你有这方面的经验吗?
更新:忘记了典型的查询:大多数查询需要时间轴上的数据:I.e。从2010年1月1日00:00到2010年3月1日00:00,给我066310站的温度。
或者:给我一个特定电台所有参数的最新值。
答案 0 :(得分:2)
当您的数据结构非常简单(例如简单的键值存储)/可预测且您不需要关系完整性或需要进行临时和/或高级查询时,NoSQL可能是合适的。
您在轻松扩展性方面取得的成就可能会失去灵活性和一致性。
最大的问题是有一种简单的方法可以对数据进行复杂的查询。我会说气象数据不是NoSQL的最佳候选者。
我个人更喜欢PostgreSQL而不是MySQL,并且在正确设置时发现它具有很高的可扩展性(即使有数百万甚至数十亿行)。
答案 1 :(得分:1)
我认为你应该尝试使用功能齐全且成熟的DBMS,然后再放弃使用SQL。
参见例如:
http://www.yafla.com/dforbes/Getting_Real_about_NoSQL_and_the_SQL_Performance_Lie/
答案 2 :(得分:1)
我发现现在很难创建一个连贯的答案,但现在就去了。
感谢收听;)