使用mlcp加载数据 - 名称空间问题

时间:2015-01-12 22:05:09

标签: marklogic mlcp

我试图将WordPress的rss数据加载到MarkLogic数据库中。数据采用以下形式:

<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0"
xmlns:excerpt="http://wordpress.org/export/1.2/excerpt/"
xmlns:content="http://purl.org/rss/1.0/modules/content/"
xmlns:wfw="http://wellformedweb.org/CommentAPI/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:wp="http://wordpress.org/export/1.2/">

<item>
  <wp:post_id>1</wp:post_id>
  <wp:post_title>title 1</wp:post_title>
  <dc:creator>bob</dc:creator>
</item>
<item>
  <wp:post_id>2</title>
  <wp:post_title>title 1</wp:post_title>
  <dc:creator>john</dc:creator>
</item>
</rss>

但是,当我运行mlcp命令时,我收到以下警告,数据未插入数据库:

WARN mapreduce.ContentWriter: XDMP-DOCNONSBIND: No namespace binding for prefix wp
WARN mapreduce.ContentWriter: XDMP-DOCNONSBIND: No namespace binding for prefix dc

我使用的mlcp命令是:

./mlcp.sh import -host localhost -port 8088 -username admin -password admin -input_file_path  data.xml -mode local -input_file_type aggregates -aggregate_record_element item -aggregate_uri_id post_id -output_uri_prefix /resources/ -output_uri_suffix .xml

知道如何解决这个问题吗?

谢谢!

2 个答案:

答案 0 :(得分:2)

您的测试用例有一个格式错误的行:<wp:post_id>2</title>。当我修复它和mlcp-Hadoop2-1.2-3与7.0-4时,我看到每个项目元素有一个警告:

15/01/12 14:16:14 WARN mapreduce.ContentWriter: XDMP-DOCNONSBIND: No namespace binding for prefix wp at /resources/1.xml line 2 15/01/12 14:16:14 WARN mapreduce.ContentWriter: XDMP-DOCNONSBIND: No namespace binding for prefix wp at /resources/2.xml line 2

这看起来像是一个mlcp错误。您的命名空间声明高于item元素的级别,并且它们不会被发送到服务器。

作为解决方法,您可以编辑XML。或者您可以使用以下内容尝试http://marklogic.github.io/recordloader/

$ recordloader.sh -DCONNECTION_STRING=xcc://admin:admin@localhost:8088 \
    -DRECORD_NAME=item -DID_NAME="#AUTO" data.xml

有关其他选项,请参阅http://marklogic.github.io/recordloader/

答案 1 :(得分:0)

它对我来说看起来像MLCP错误。但是,在放弃之前,请尝试向根元素添加默认命名空间,因此它将类似于:

<rss version="2.0" xmlns="http://yournamespace.com/" 
xmlns:excerpt="http://wordpress.org/export/1.2/excerpt/"
xmlns:content="http://purl.org/rss/1.0/modules/content/"
xmlns:wfw="http://wellformedweb.org/CommentAPI/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:wp="http://wordpress.org/export/1.2/">