NoSQL是否适合存储统计数据?

时间:2010-03-24 19:02:31

标签: statistics nosql

我对NoSQL系统并不十分熟悉,但我记得有一段时间他们认为它们是处理统计数据的理想选择。

由于我即将开始编写将记录“每天注册了多少用户”等数据的代码,我以为我可以利用这个机会了解更多有关NoSQL的信息。 / p>

如果NoSQL确实非常理想,您能否提供一些有关原因的信息?哪种特定系统最适合这种特殊需求?

因此,在第一个答案之后,或许澄清一点是有帮助的。

我目前有一个PostgreSQL数据库,我将从中获取数据。它将非常简单,无需计算。例如,我将获得一个结果集,其中包含过去一个月每天注册的用户数量(因此它基本上只是一组日期/用户的值对)并将其保存在另一个表/数据库中。

谢谢!

2 个答案:

答案 0 :(得分:5)

这取决于您将对这些统计数据进行哪种分析。如果您要进行大量不同的操作(平均,求和,加入......),您可能会发现NoSQL解决方案更加难以理解它们的价值。

但是,如果您存储的统计信息主要用于显示目的,或者用于非常特定的分析例程,NoSQL解决方案就会开始闪耀。

如果您的数据足够小,请坚持使用SQL解决方案,这样可以提供完整查询引擎的优势,但是如果您有很多值(即使您正在运行,每天只有一个值一百万年以来,并且担心存储大小和性能,NoSQL选项再一次可能是值得的。

如果您的数据是半结构化的,请查看CouchDB,它提供了一些基本的索引和查询支持,这可以为分析例程提供一些基础。如果您存储的结构非常少,那么我最好的建议就是看看Tokyo Cabinet和Tokyo Tyrant,它们是键值存储绝对令人难以置信的选择。

答案 1 :(得分:0)

NoSQL系统倾向于优化频繁存储数据但不经常访问的情况。在统计数据的情况下,您可能经常以小比特从(社交)站点收集大量数据,这些数据经过优化。但检索和分析可能会更慢......当然,这取决于您决定使用哪个“NoSql”系统。