是否可以从Marklogic服务器搜索和查询hdfs上的数据,而无需将数据导入Marklogic服务器数据库?我已经能够将数据导入Marklogic服务器数据库。但是无法找到有关如何在不导入的情况下查询数据的任何细节。如果有方法请帮助解决如何操作????
答案 0 :(得分:0)
我不确定你的意思是"查询"。要以任何有意义的方式查询数据,数据需要位于数据库中。但HDFS不是数据库。
如果您想将森林保留在HDFS上,您可以这样做:请参阅MarkLogic HDFS docs。
如果您希望将HDFS视为本地文件系统,则xdmp:filesystem-directory
和xdmp:filesystem-get
等内置函数似乎接受hdfs://
个网址。请注意,您需要将MarkLogic配置为HDFS客户端,如MarkLogic HDFS docs中所述。否则,以这种方式访问HDFS的任何尝试都将抛出SVC-HDFSNOT
。
或者,如果您可以在HDFS上设置或构建HTTP REST-ish接口,则可以使用xdmp:http-get
及相关功能。
答案 1 :(得分:0)
可以从Marklogic使用连接器,但是您需要使用Key,Value pair构建序列文件