我有一个格式正确的单个json文件,它是一个文档数组(大约60,000)。我可以使用节点api导入它,但只是想知道如何使用Marklogic内容泵(窗口)导入此文件。
我尝试使用基本选项,它只创建一个名为orders.json的文档
答案 0 :(得分:2)
对于MLCP,格式正确的JSON聚合(Called Line-delimited JSON)文件不是对象数组。它是一个文件,每行一个字符串化对象。想想CSV,而不是JSON。
想象一下,如果你传递了一个数组--MLCP进程必须将整个文件解析成一个JSON数组来处理。每行一个对象意味着MLCP可以轻松地对文件进行分片并并行处理。事实上,如果您使用自动URI,我认为它甚至不会解析为JSON。
为:
[
{
"bar": "baz"
},
{
"bar": "buz"
}
]
好:
{"bar":"baz"}
{"bar":"buz"}
关于这一切的所有好处都可以在这里找到:
MLCP User Guide
相关部分为: (准确的文件版本:' 9.0-3,2017年9月')