包含多个文件的tgz / zip文件夹在hdfs中解压缩

时间:2018-09-07 01:08:15

标签: hadoop hdfs unzip

所以我有一个压缩并运送到hdfs的文件夹,我需要将此文件夹解压缩到hdfs中,同时将所有文件保留在该文件夹中。

我能够跑步

hdfs dfs -cat /user/USERNAME/MYFOLDER/zipped_folder.tgz | zcat | hdfs dfs -put - /user/USERNAME/MYFOLDER/

这可以解压缩数据,但会将所有数据放入1个“-”文件中。我需要将解压缩后的文件保持原样,而不是将其合并为1个文件。

hdfs中有办法做到这一点吗?如果有任何区别,我将文件夹复制为.zip和.tgz。

欢呼

P.S:我无权访问本地目录,该文件夹已经在hdfs中。

0 个答案:

没有答案