我正在寻找一款用于管理大型内容集合的软件,例如300MB的HTML。它需要分支和合并,并且应尽可能分发(即,dvcs)。
需要全文索引。
需要基于网络的界面。
还有什么吗?这是一个大项目,需要我花费大量时间来创建。
自己构建,我会结合使用Git,JGit,Lucene和Play框架。
一个特别的问题是300MB的文本被分成200,000个文件或记录。这个数量的文件通常不是很快,所以跳过git的标准文件系统工作模型可能会很好....
答案 0 :(得分:1)
好吧,我的答案是GIT。
没有比git更快,更可靠地处理许多基于文本的文件的更好的版本控制系统。
对于基于Web的界面 - 请参阅CGIT