我的数据库中有数百万个不同集合中的文档。指定集合名称后,我需要将它们导出到本地存储中的csv。
我尝试了mlcp导出,但是没有用。由于某些问题,我们不能为此使用corb。
我希望csv的格式应为:如果我尝试导入mlcp,那么我应该能够按照原样恢复所有文档。
答案 0 :(得分:3)
我的第一个想法是使用MLCP存档功能,并且完全不导出到CSV。
如果您真的想要CSV,Corb2将是我的第一个想法。它提供了开箱即用的CSV导出功能。可能值得深入探讨为什么这对您不起作用。
DMSDK也可以工作,但是涉及编写处理CSV编写的代码,这对我来说很麻烦。
想到的最后一个选择是Apache NiFi,其使用各种MarkLogic Processors。它允许非常通用地编排数据流。但是,出于您的目的,这可能会太过分了。
HTH!
答案 1 :(得分:1)
ml-gradle支持导出文档和引用转换,该转换可以将每个文档转换为CSV-https://github.com/marklogic-community/ml-gradle/wiki/Exporting-data#exporting-data-to-csv。
除非所有文档都是平坦的,否则可能需要一些自定义代码来确定如何将层次结构文档映射到平坦的行中。因此,REST转换在那里是一个合理的解决方案。
您还可以使用TDE模板将文档投影到行中,并且/ v1 / rows端点可以将结果作为CSV返回。当然,这需要创建并加载TDE模板,然后等待匹配的文档被重新索引。