所以,假设我有一个appx网站。 40000篇文章。 我希望做的是记录每篇文章加班的页面访问次数。
基本上,最终目标是能够通过图形显示任何时间段内任何文章的查找次数。
这是一个例子:https://books.google.com/ngrams
我开始考虑mysql数据结构 - >但我的大脑告诉我,这可能不是mysql的正确任务。几乎看起来我需要使用一些特定的nosql分析解决方案。
有人可以建议什么数据库适合这项工作吗?
答案 0 :(得分:0)
SQL很好。它支持UPDATE
语句,保证您的计数正确,而不仅仅是最终的一致性。
虽然大多数人只会使用日志文件,但按需处理。除非你是谷歌规模,否则这将足够快。
存在许多用于此的工具,通常包括一些非常有效的专用数据结构,例如您在任何数据库中都找不到的RDD。为什么不直接使用它们?