Hadoop存档文件不删除源文件

时间:2017-08-22 15:37:24

标签: hadoop hdfs

我有一个包含大量小文件的源文件夹。我想将所有文件包装到Hadoop加密区中的单个文件或容器中。

hadoop archive -archiveName test.har -p /user/source /user/outputdir

上面的命令将在outputdir中创建一个.har文件。但源文件夹中的文件仍然存在。

有没有办法可以删除源文件夹中存在的所有小文件并创建一个存档文件。如果是这样,如何取消归档并取回源文件?

1 个答案:

答案 0 :(得分:0)

即使创建了存档文件,源文件仍然存在。唯一的解决方案是从hadoop加密区删除文件。

hadoop fs -rm -r -skipTrash /user/source/*.*

关于取消归档:

hdfs dfs -cp /user/outputdir/test.har /user/new_destination