我有一个包含简历的巨大XML文件。这个文件有两种格式 - 包含所有简历的单个主文件 -
<Resumes>
<Resume>
<Name>ABC</Name>
......
......
</Resume>
<Resume>
<Name>PQR</Name>
......
......
</Resume>
......
......
</Resumes>
以及前面的多个文件
文件1 -
<Resumes>
<Resume>
<Name>ABC</Name>
......
......
</Resume>
</Resumes>
文件-2
<Resumes>
<Resume>
<Name>PQR</Name>
......
......
</Resume>
</Resumes>
等等。
我想使用baseX
或eXist
XML DB来存储XML。所以将来,如果我想
添加更多简历(采用XML格式)然后哪个会更好?
答案 0 :(得分:2)
对于eXist-db,让我引用a post on exist-open by Wolfgang Meier来回答类似的问题:
我认为没有理论限制,但肯定存在 一些实际考虑因素。存储非常大的文档可能会阻止 数据库不仅存储了许多小数据库。它需要一个单一的 事务(以及事务日志的足够磁盘空间)。
dblp参考书目,我将其用于某些自动化性能 测试,作为一个超过600mb的单个文档。这加载 好吧,如果你稍微增加缓存大小和内存设置。一世 知道其他用户必须处理更大的文件(很多 gigabytes),但是如果你有选择的话,我肯定会推荐给你 将数据拆分为较小的块,这些块更容易处理。
当然,自2009年11月Wolfgang写这篇文章以来,eXist-db变得更加高效和强大,但我认为他的建议仍然适用。两个最后的注释:
确保使用最新版本的eXist,例如: 1.4.2或2.0 Tech Preview。这些都得益于我所谈到的进步。
要挤出eXist-db的最佳性能,请阅读标题为Performance Tuning的eXist-db文档文章。