有没有办法通过hadoop中的webhdfs拉出整个目录?

时间:2014-10-13 05:28:30

标签: hadoop webhdfs distcp

我们有两个集群,我们的要求是将数据从一个集群拉到另一个集群。

我们唯一可用的选项是,通过webhdfs提取数据!!

但不幸的是,我们可以看到,通过webhdfs,我们一次只能拉一个文件,这也需要为每个文件执行两个命令。

我的直接问题是:有没有办法通过webhdfs,我们可以拉出整个目录数据?

**Ex:** 
**directory structure in the cluster:**

dir1

        file1

        file2

        file3 


**currently observed that,** 

for every file i.e 1,2 & 3, i need to execute two commands to get data.

**Problem statement:** 

Is there a way thru webhdfs, to get all the files in a single call i.e., files 1,2 & 3 at a time from dir1 ...!!!!

有人可以帮我解决这个问题......

注意:由于安全措施,DISTCP不是我们的工作选项!!

0 个答案:

没有答案