我们有两个集群,我们的要求是将数据从一个集群拉到另一个集群。
我们唯一可用的选项是,通过webhdfs提取数据!!
但不幸的是,我们可以看到,通过webhdfs,我们一次只能拉一个文件,这也需要为每个文件执行两个命令。
我的直接问题是:有没有办法通过webhdfs,我们可以拉出整个目录数据?
**Ex:**
**directory structure in the cluster:**
dir1
file1
file2
file3
**currently observed that,**
for every file i.e 1,2 & 3, i need to execute two commands to get data.
**Problem statement:**
Is there a way thru webhdfs, to get all the files in a single call i.e., files 1,2 & 3 at a time from dir1 ...!!!!
有人可以帮我解决这个问题......
注意:由于安全措施,DISTCP不是我们的工作选项!!