从Hadoop Trash中有选择地删除内容

时间:2014-07-22 21:58:43

标签: hadoop hdfs cloudera

Hadoop会根据fs.trash.interval定期从“废纸篓”中删除内容。此外,用户可以通过删除命令触发删除操作,但这只会删除早于时间间隔的文件。如果我想有选择地删除垃圾桶中的某些大文件以恢复空间,该怎么办?这样做的缺点是什么?

1 个答案:

答案 0 :(得分:3)

对于从Hadoop中有选择地删除,有两种创造性方法

第一

完全删除文件或在命令

下跳过要删除的文件的“废纸篓”
hadoop fs -rm -R -skipTrash /folder-path

第二

从您要保留的垃圾箱中恢复文件清空可为您腾出空间的垃圾箱。

hadoop fs -expunge