我是Marklogic的新手,我尝试将我的100k记录的CSV文件导入Marklogic,导入后,我发现它默认导入到Documents Database。此外,我发现每个记录,我看到在数据库中生成的XML文件,增量号附加到我在导入时提到的“documentUri”。例如:documentUri_1.xml。我理解创建多个xml文件以便以分布式方式读取数据。
问题: 1.如何获取此文档的根文档URI?哪个有多个xml文件? 问题:2。如何将相同的CSV文件导入其他数据库? 问题:3。当我使用xquery列出数据库中的所有文档时,我得到所有的所有xml文件URI而不仅仅是dummy.xml uri?我如何实现这一目标?
注意:我使用以下命令导入:
mlcp.bat import -host localhost -port 8000 -username admin -password admin -input_file_path dummy.csv -mode local -input_file_type delimited_text -uri_id 'dummy.xml'
你能帮助我吗?
答案 0 :(得分:3)
问题1)没有"根文件"。每个文件都独立存在。但您可以通过收集将文档分组(见下文)。
问题2)使用-database mlcp选项。
问题3)我认为您正在寻找mlcp选项-filename_as_collection。这将允许您按文件命名的集合查找文档。例如,在XQuery中:
collection("dummy.csv")
答案 1 :(得分:1)
答案不起作用,因为您的示例不包含推荐的命令选项
-filename_as_collection
不在:
mlcp.bat import -host localhost -port 8000 -username admin -password admin -input_file_path dummy.csv -mode local -input_file_type delimited_text -uri_id 'dummy.xml'