我有一个慢慢增长的大约300万个标记文档的集合,我希望能够通过标记尽可能合理地选择来自此集合的文档(即不在c中编写自定义索引解决方案)。
例如,我想选择所有标记为“foo”和“bar”的文档,或者选择所有标记为“foo”且不是“bar”的文档。
另一个问题是标签的数量很多(?):当前为200k,计划为0.5-1kk,最差情况为2kk。 我知道这些数字不是现代标准所不同的,但我个人从未使用过如此大的数据集,我对数据库的整体体验有限,而且有很多选择......
现在我正在考虑mongodb,因为它正是我所需要的 - 多键。 mongobd对快速查询有好处吗?
其他看似相似的nosql项目(例如CouchDb)会更好地服务于我的目的吗?或者我应该尝试好的旧MySQL吗?
我应该看看像Hypetable或hbase这样的“大牌”项目吗?
答案 0 :(得分:0)