我正在尝试决定是否将voldemort或couchdb用于即将到来的医疗保健项目。我想要一个具有高可用性,容错能力的存储系统,并且可以扩展它所投入的大量数据。
每个人的利弊是什么?
由于
答案 0 :(得分:5)
Project Voldemort看起来不错,但到目前为止我还没有深入研究过它。
在目前状态下,CouchDB可能不适合“海量数据”。在节点之间分发数据并相应地路由查询是在路线图上,但到目前为止还没有实现。 CouchDB最大的已知生产设置使用大约200G的“表格”(沙发上的“数据库”)。
CouchDB本身不支持HA,但可以轻松构建:所有CouchDB节点都在多主设置中复制彼此之间的数据库节点。我们在CouchDB机器前放置了两个Varnish proxies,并且使用CARP使Varnish盒子变得多余。 CouchDBs“从Web构建”设计使这些事情变得非常容易。
our setup中最紧迫的问题是将大型(多MB)附件复制到CouchDB文档仍然存在问题。
我建议您也检查传统的RDBMS路由。 There are huge issues具有RDBMS方法之外的可用人才,并且Oracle和Linux提供了非常强大的产品。有限公司
答案 1 :(得分:4)
从你的问题不太了解,我会说,像CouchDB这样的Project Voldemort或分布式哈希表( DHTs )通常是解决你的HA问题的解决方案。
那些DHT非常适合高可用性,但是比传统的关系数据库(RDBMS)更难编写代码来保持一致性。
它们非常适合存储文档类型信息,这些信息可能非常适合您的医疗保健项目,但会使数据开发更加困难。
了解有关一致性与可用性的 BASE 和 CAP 定义。
见
答案 2 :(得分:1)
memcacheDB 是一个选项吗?我听说过Digg处理HA问题的方式。