有人可以建议一个数据库解决方案来存储大型文档,这些文档将有多个分支修订版吗?应该可以对内容进行部分编辑,而无需更新整个文档。
我正在研究XML数据库并想知道它们的适用性,甚至可能使用DVCS(如Mercurial)。
最好应该有Python绑定。
答案 0 :(得分:1)
尝试Fossil - 它有一个很好的增量编码算法,并保留所有版本。它由单个SQLite数据库支持,并且具有基于Web和命令行UI。
答案 1 :(得分:0)
这取决于您的存储行为和用例。如果您计划存储大量“文档修订版”并保留历史版本,并且可以遵循一次写入多次读取模式,那么您应该研究类似Hadoop HDFS的内容。这需要很多(便宜的)基础架构来运行您的集群,但是您将能够不断添加修订/数据,并且能够使用MapReduce算法快速查找它。