我读了一篇名为“动手实践的卡桑德拉”的文章,Tokyo Cabinet对大数据不利。为什么?在开始工作之前TC需要存储多少字节?是否可以确定近似值?
答案 0 :(得分:2)
根据this article,确认性能下降超过500GB。
基于NoSQL数据库的这种广泛比较,TC中的问题始于> 20mm行。
大小依赖的可能原因之一是,似乎TC是使用哈希实现的,并且在某些时候你会遇到哈希键冲突,这当然会破坏性能。默认情况下,密钥空间不是那么大(您需要调整“bnum”参数 - 桶阵列的元素数量 - 以提高性能)
基于各种比较,MongoDB似乎是大型数据集的推荐方法。