我想将MarkLogic中存储的二进制(PPTX)文件导出到我的本地文件系统。是否可以通过MLCP EXPORT导出存储在URI中的文档?
同一目录中存储着数百万个文档-因此带有MLCP EXPORT
选项的-directory_filter
毫无用处。导出操作开始并出现错误,并显示“ RequestException实例化ResultItem 141931:超出了时间限制”。
这是我的选项文件
-host
marklogic-dev-server
-port
9014
-username
pk
-password
pk
-directory_filter
/openxml2/
#-query_filter
#doc("/openxml2/doc-uri.pptx")
-output_type
archive
-output_file_path
/Users/pk/marklogic/
-compress
true````
答案 0 :(得分:1)
默认情况下,MLCP将导出文档中的native format:
使用mlcp export命令导出文档的原始文档 格式作为本机文件系统或HDFS上的文件。例如,您可以 将XML文档导出为包含XML的文本文件或二进制文件 文档作为JPG图像。
使用mlcp export命令以原始格式将文档导出为本机文件系统或HDFS上的文件。例如,您可以将XML文档导出为包含XML的文本文件,或者将二进制文档导出为JPG图像。
有一个number of different ways to limit the documents exported by MCLP。
您应该可以使用-query_filter
, -query_options
或-document_selector自己选择文件。
或者,您可以将文档添加到新集合中,并使用-collection_filter
。对于少量文档来说这是可以的,但对于较大的文档集则不建议这样做,因为将集合添加到大量文档中可能会占用大量资源。