Marklogic:在导入csv时在文档上创建多个XML文件。如何获取根文档URI路径?

时间:2016-04-18 15:41:57

标签: xml database csv xquery marklogic

我是Marklogic的新手,我尝试将我的100k记录的CSV文件导入Marklogic,导入后,我发现它默认导入到Documents Database。此外,我发现每个记录,我看到在数据库中生成的XML文件,增量号附加到我在导入时提到的“documentUri”。例如:documentUri_1.xml。我理解创建多个xml文件以便以分布式方式读取数据。

  

问题:   1.如何获取此文档的根文档URI?哪个有多个xml文件?   问题:2。如何将相同的CSV文件导入其他数据库?   问题:3。当我使用xquery列出数据库中的所有文档时,我得到所有的所有xml文件URI而不仅仅是dummy.xml uri?我如何实现这一目标?

注意:我使用以下命令导入:

mlcp.bat import -host localhost -port 8000 -username admin -password admin -input_file_path dummy.csv -mode local -input_file_type delimited_text -uri_id 'dummy.xml'

你能帮助我吗?

2 个答案:

答案 0 :(得分:3)

问题1)没有"根文件"。每个文件都独立存在。但您可以通过收集将文档分组(见下文)。

问题2)使用-database mlcp选项。

问题3)我认为您正在寻找mlcp选项-filename_as_collection。这将允许您按文件命名的集合查找文档。例如,在XQuery中:

collection("dummy.csv")

答案 1 :(得分:1)

答案不起作用,因为您的示例不包含推荐的命令选项

 -filename_as_collection 

不在:

mlcp.bat import -host localhost -port 8000 -username admin -password admin -input_file_path dummy.csv -mode local -input_file_type delimited_text -uri_id 'dummy.xml'