我可能有一个愚蠢的问题,但我找不到任何明确的元素,所以我得到一个拍摄:
似乎xml数据库中的设计模式是将xml文件视为" rows"来自关系的。我在MarkLogic上发现了明确的建议,建议使用多个xml文件而不是大文件。但是在eXist-db上找不到相同的东西。它也是推荐的吗?我的意思是,我应该使用多个(千?)xml文件还是大文件?存在什么是最好的db?
我可以有一些虚拟的例子:
客户(让他们说100,000)与个人信息(让我们说15个带有文本内容的xml元素):每个客户一个xml文件或所有客户的一个文件?
答案 0 :(得分:3)
对于查询,如果数据存储在许多小文档或大文档中,则它不会产生很大的不同。对于更新,通常优选小文档。替换小文档通常更有效,而不是在大文档上运行更新。
这实际上取决于数据变化的频率。如果以高频率进行更新,则维护小文档可能更有效。为了简化维护并提高性能,您甚至可以考虑根据某些标准将文档组织到较小的子集合中。注意:如果您使用数千个小文档,请不要忘记增加collectionCache设置。