通过MLCP提取存储在Archive中的XML

时间:2018-08-09 12:29:56

标签: marklogic marklogic-8 mlcp

使用以下命令通过MLCP导入存档中存储的XML文档时:

mlcp import -mode local -host localhost -input_file_path "D:\xmlworkflow\test" -input_file_type archive -username admin -password admin -port 8000 -database Documents -input_file_pattern ".*/*.zip" -output_uri_prefix "/modules/" 

我收到以下错误:

18/08/10 11:09:41 INFO contentpump.LocalJobRunner: Content type: XML 
18/08/10 11:09:41 INFO contentpump.FileAndDirectoryInputFormat: Total input paths to process : 2 
18/08/10 11:09:41 ERROR contentpump.LocalJobRunner: Error getting input splits: 
18/08/10 11:09:41 ERROR contentpump.LocalJobRunner: Not type information in Archive name

我正在使用MarkLogic 8.0-7.1。

有人对此错误有任何想法吗?

1 个答案:

答案 0 :(得分:1)

输入文件类型archive是指通过MLCP归档文件导出(-output_type archive)创建的MLCP归档文件zip文件。

我认为您打算改用-input_compressed。像这样:

mlcp.bat import -mode local -host localhost -input_file_path "D:\xmlworkflow\test" -input_compressed -username xxx -password yyy -port 8000 -database Documents -input_file_pattern ".*/*.zip" -output_uri_prefix "/modules/"

要有选择地导入特定文件,我建议使用一种转换,如果应摄取该文件,则通过$content;如果跳过该文件,则通过()(空序列)。

有关MLCP转换的文档可以在这里找到:

http://docs.marklogic.com/guide/mlcp/import#id_82518

HTH!