XQuery-单个文件或多个文件在任何XML DB中都是好的

时间:2012-04-27 12:34:49

标签: xml xquery exist-db basex

我有一个包含简历的巨大XML文件。这个文件有两种格式 - 包含所有简历的单个主文件 -

<Resumes>
  <Resume>
    <Name>ABC</Name>
    ......
    ......
  </Resume>
  <Resume>
    <Name>PQR</Name>
    ......
    ......
  </Resume>
  ......
  ......
</Resumes>

以及前面的多个文件

文件1 -

<Resumes>
  <Resume>
    <Name>ABC</Name>
    ......
    ......
  </Resume>
</Resumes>

文件-2

<Resumes>
  <Resume>
    <Name>PQR</Name>
    ......
    ......
  </Resume>
</Resumes>

等等。

我想使用baseXeXist XML DB来存储XML。所以将来,如果我想 添加更多简历(采用XML格式)然后哪个会更好?

1 个答案:

答案 0 :(得分:2)

对于eXist-db,让我引用a post on exist-open by Wolfgang Meier来回答类似的问题:

  

我认为没有理论限制,但肯定存在   一些实际考虑因素。存储非常大的文档可能会阻止   数据库不仅存储了许多小数据库。它需要一个单一的   事务(以及事务日志的足够磁盘空间)。

     

dblp参考书目,我将其用于某些自动化性能   测试,作为一个超过600mb的单个文档。这加载   好吧,如果你稍微增加缓存大小和内存设置。一世   知道其他用户必须处理更大的文件(很多   gigabytes),但是如果你有选择的话,我肯定会推荐给你   将数据拆分为较小的块,这些块更容易处理。

当然,自2009年11月Wolfgang写这篇文章以来,eXist-db变得更加高效和强大,但我认为他的建议仍然适用。两个最后的注释:

  1. 确保使用最新版本的eXist,例如: 1.4.22.0 Tech Preview。这些都得益于我所谈到的进步。

  2. 要挤出eXist-db的最佳性能,请阅读标题为Performance Tuning的eXist-db文档文章。