如何使用marklogic mapreduce连接器api向文档添加元数据

时间:2017-01-03 07:55:31

标签: hadoop mapreduce marklogic

我想使用marklogic mapreduce api将文档写入marklogic数据库,这里可以说是example。我想在文档中添加元数据,我将它写回reducer中的marklogic数据库 -

context.write(outputURI, result);

如果可以使用marklogic的mapreduce api向文档添加元数据,请告诉我。

2 个答案:

答案 0 :(得分:1)

对于元数据,我假设您正在讨论文档属性片段。有关文档属性的背景信息,请参阅此处:https://docs.marklogic.com/guide/app-dev/properties#id_19516

用于MarkLogic mapreduce,请参见此处(输出类): https://docs.marklogic.com/guide/mapreduce/output#id_76625

我相信您需要扩展/修改您的示例,以便使用PropertyOutputFormat类将内容写入属性片段。

同一文档中的一个示例应用程序是在属性片段中保存内容的示例。但是,如果您希望通过查看一些源代码来快速跟踪自己:请参阅一些示例 - 包括写入文档属性片段,请参阅此处:https://gist.github.com/evanlenz/2484318 - 特别是LinkCountInProperty.java

答案 1 :(得分:0)

使用配置xml的属性 mapreduce.marklogic.output.content.collection 。添加此属性会将插入的数据添加到该集合中。