我正在开发一个网络应用程序,用于分析网络上的内容。目标是识别这些文章中的术语并对其进行分类,检查这些术语是否属于给定的术语列表,并计算它们出现的频率。
实体包括:
示例查询包括:
考虑到每篇文章可能有几千个术语和数千篇文章,您将如何存储数据?
规范化的关系数据库是否有意义?我应该反规范化还是使用NoSQL数据库?
答案 0 :(得分:1)
规范化的关系数据库(RDBMS)对我来说总是有意义的。标准化为您提供了最常见查询的一致性和速度方面的改进。
如果你的实体很简单(id和一堆属性),你也可以考虑使用NoSQL解决方案,因此你并不需要RDBMS的强大功能。
在您的情况下,我会选择一个设计良好,一劳永逸的RDBMS解决方案。 MySQL对于这项工作来说将是完美的。