存储大型文档的数据库

时间:2011-07-05 02:40:19

标签: database document

有人可以建议一个数据库解决方案来存储大型文档,这些文档将有多个分支修订版吗?应该可以对内容进行部分编辑,而无需更新整个文档。

我正在研究XML数据库并想知道它们的适用性,甚至可能使用DVCS(如Mercurial)。

最好应该有Python绑定。

2 个答案:

答案 0 :(得分:1)

尝试Fossil - 它有一个很好的增量编码算法,并保留所有版本。它由单个SQLite数据库支持,并且具有基于Web和命令行UI。

答案 1 :(得分:0)

这取决于您的存储行为和用例。如果您计划存储大量“文档修订版”并保留历史版本,并且可以遵循一次写入多次读取模式,那么您应该研究类似Hadoop HDFS的内容。这需要很多(便宜的)基础架构来运行您的集群,但是您将能够不断添加修订/数据,并且能够使用MapReduce算法快速查找它。