Marklogic查询HDFS

时间:2014-11-27 11:41:52

标签: marklogic

是否可以从Marklogic服务器搜索和查询hdfs上的数据,而无需将数据导入Marklogic服务器数据库?我已经能够将数据导入Marklogic服务器数据库。但是无法找到有关如何在不导入的情况下查询数据的任何细节。如果有方法请帮助解决如何操作????

2 个答案:

答案 0 :(得分:0)

我不确定你的意思是"查询"。要以任何有意义的方式查询数据,数据需要位于数据库中。但HDFS不是数据库。

如果您想将森林保留在HDFS上,您可以这样做:请参阅MarkLogic HDFS docs

如果您希望将HDFS视为本地文件系统,则xdmp:filesystem-directoryxdmp:filesystem-get等内置函数似乎接受hdfs://个网址。请注意,您需要将MarkLogic配置为HDFS客户端,如MarkLogic HDFS docs中所述。否则,以这种方式访问​​HDFS的任何尝试都将抛出SVC-HDFSNOT

或者,如果您可以在HDFS上设置或构建HTTP REST-ish接口,则可以使用xdmp:http-get及相关功能。

答案 1 :(得分:0)

可以从Marklogic使用连接器,但是您需要使用Key,Value pair构建序列文件