MLCP命令选项以导出二进制文件

时间:2019-08-15 17:54:12

标签: marklogic mlcp

我想将MarkLogic中存储的二进制(PPTX)文件导出到我的本地文件系统。是否可以通过MLCP EXPORT导出存储在URI中的文档?

同一目录中存储着数百万个文档-因此带有MLCP EXPORT选项的-directory_filter毫无用处。导出操作开始并出现错误,并显示“ RequestException实例化ResultItem 141931:超出了时间限制”。

这是我的选项文件

-host
marklogic-dev-server
-port
9014
-username
pk
-password
pk
-directory_filter
/openxml2/
#-query_filter
#doc("/openxml2/doc-uri.pptx")
-output_type
archive
-output_file_path
/Users/pk/marklogic/
-compress
true````

1 个答案:

答案 0 :(得分:1)

默认情况下,MLCP将导出文档中的native format

  

使用mlcp export命令导出文档的原始文档   格式作为本机文件系统或HDFS上的文件。例如,您可以   将XML文档导出为包含XML的文本文件或二进制文件   文档作为JPG图像。

使用mlcp export命令以原始格式将文档导出为本机文件系统或HDFS上的文件。例如,您可以将XML文档导出为包含XML的文本文件,或者将二进制文档导出为JPG图像。 有一个number of different ways to limit the documents exported by MCLP。 您应该可以使用-query_filter, -query_options或-document_selector自己选择文件。

或者,您可以将文档添加到新集合中,并使用-collection_filter。对于少量文档来说这是可以的,但对于较大的文档集则不建议这样做,因为将集合添加到大量文档中可能会占用大量资源。